JP7534749B2 - Healthcare Systems and Programs - Google Patents
Healthcare Systems and Programs Download PDFInfo
- Publication number
- JP7534749B2 JP7534749B2 JP2020191230A JP2020191230A JP7534749B2 JP 7534749 B2 JP7534749 B2 JP 7534749B2 JP 2020191230 A JP2020191230 A JP 2020191230A JP 2020191230 A JP2020191230 A JP 2020191230A JP 7534749 B2 JP7534749 B2 JP 7534749B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- health
- judgment
- classification
- prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Medical Treatment And Welfare Office Work (AREA)
Description
本発明は、組織体の構成員のヘルスケアを支援するヘルスケアシステム、および、ヘルスケアプログラムに関する。 The present invention relates to a healthcare system and a healthcare program that support the healthcare of members of an organization.
特許文献1には、目的変数に健康状態(健診データ)を設定し、説明変数に勤怠データを時間的な分解を行い集計(月次など)したデータを設定して、機械学習などの予測用機械学習モデルを作り、その機械学習モデルに、従業員の勤怠データを入力すると影響のある説明変数とその値が分かる。その影響のある説明変数の元の勤怠データを要約説明として出力する。また、他の勤怠データを入力すると、その勤怠での健康状態を予測する。特許文献1では、従業員を、「勤怠データ」、「健診データ」、「事業所や職種といった項目」で分類(グループ化)したデータでの予測を行っている。 In Patent Document 1, health status (health checkup data) is set as the objective variable, and data obtained by breaking down attendance data over time and aggregating it (monthly, etc.) is set as the explanatory variable to create a machine learning model for prediction using machine learning or other methods. When an employee's attendance data is input into this machine learning model, the influential explanatory variables and their values can be determined. The original attendance data for the influential explanatory variables is output as a summary explanation. Furthermore, when other attendance data is input, the health status for that attendance is predicted. In Patent Document 1, predictions are made using data in which employees are classified (grouped) by "attendance data," "health checkup data," and "items such as place of business and type of job."
特許文献2には、健康状態(健診結果)とアンケートを元に分類(グループ化)し、そのグループのアンケートから更に特徴抽出し、指導を行うことが記載されている。
特許文献3には、ストレスチェックのデータと勤怠データ、生体データ(唾液)を多変量解析によって重みづけパラメータとし、これにストレスチェックと勤怠データ、生体データ(唾液)を与えることで、経年のストレス予測データを作成することが記載されている。
Japanese Patent Laid-Open No. 2003-233693 describes classifying (grouping) people based on their health condition (health checkup results) and a questionnaire, extracting characteristics from the questionnaire of each group, and providing guidance.
Patent document 3 describes how stress check data, attendance data, and biometric data (saliva) are used as weighting parameters through multivariate analysis, and by applying the stress check data, attendance data, and biometric data (saliva) to this, stress prediction data over the course of years is created.
特許文献1は、説明変数を勤怠データとしているだけなので、勤務状態が類似していると、類似の健康状態が予測されてしまう可能性がある。例えば、同じような勤務状態の従業員であっても日々の運動習慣、飲酒量などの生活習慣が異なれば、健康状態も非類似のものになるはずである。また、特許文献2は、従業員の将来を予測するものではない。さらに、特許文献3は、重みづけパラメータとし、これにストレスチェックと勤怠データ、生体データ(唾液)を与えることで、経年のストレス予測データを作成するものであり、生活習慣を考慮したものではない。 In Patent Document 1, the explanatory variable is simply attendance data, so there is a possibility that similar health conditions will be predicted if working conditions are similar. For example, even if employees have similar working conditions, if their daily exercise habits, alcohol consumption, and other lifestyle habits are different, their health conditions will be dissimilar. Furthermore, Patent Document 2 does not predict an employee's future. Furthermore, Patent Document 3 uses weighting parameters and applies stress checks, attendance data, and biological data (saliva) to this to create stress prediction data over time, but does not take lifestyle habits into account.
上記課題を解決するためのヘルスケアシステムでは、複数の組織体における、構成員の健康診断結果にかかわる健診判定データを集計した健診判定集計データ、前記構成員のストレスチェック結果にかかわるストレスチェック判定データを集計したストレスチェック判定集計データ、前記構成員ごとの勤怠にかかわる勤怠履歴を集計した勤怠集計データ、および、人事にかかわる人事履歴データ、ならびに、各構成員における、勤怠にかかわる勤怠履歴データ、および、生活習慣にかかわる生活習慣履歴データの各々が項目データであって、前記項目データの集合が働き方データである。前記ヘルスケアシステムは、前記働き方データを予測対象者における健康診断およびストレスチェックにかかわる項目の判定予測に用いるヘルスケアシステムである。そして、前記働き方データの各項目データを機械学習によって複数種類に分類する分類用機械学習モデルを生成する働き方データ分類部と、前記構成員の健康診断およびストレスチェックが実施された実施日をもとに、今回と前回の2回分の健診判定データとストレスチェック判定データとを結合した健康関連結合データであって、前記健康関連結合データと前記構成員の健康診断およびストレスチェックにかかわる項目の前回の判定の実施日を起点として遡った期間の前記働き方データとを結合した初期結合データを生成し、前記初期結合データを前記働き方データ分類部が複数種類に分類し、その分類ごとに前記初期結合データを分割した分類データを生成する分類データ生成部と、前記分類データごとに、今回の前記構成員の健診判定データおよびストレスチェック判定データにかかわる判定を目的変数とし、前記働き方データの各項目データ、および、前回の前記構成員の健診判定データおよびストレスチェック判定データにかかわる判定を説明変数に設定して教師データを生成する教師データ生成部と、前記説明変数の判定ごとに、前記目的変数の予測用機械学習モデルを生成する学習部と、予測対象者である構成員における健康診断およびストレスチェックにかかわる項目の今回の判定の実施日を起点として遡った期間の前記働き方データ、および、前記予測対象者である構成員の今回の健診判定データとストレスチェック判定データとを結合した予測対象者データを前記分類用機械学習モデルを用いて分類し、分類結果に応じた前記予測用機械学習モデルを用いて、前記予測対象者データを説明変数に設定して目的変数である将来の健康診断およびストレスチェックにかかわる項目の判定を予測する予測部とを備える。 In a healthcare system for solving the above problem, health checkup judgment aggregate data that is an aggregate of health checkup judgment data related to health checkup results of members of a plurality of organizations, stress check judgment aggregate data that is an aggregate of stress check judgment data related to stress check results of the members, attendance aggregate data that is an aggregate of attendance history related to attendance for each of the members, personnel history data related to personnel, and attendance history data related to attendance and lifestyle history data related to lifestyle for each member are each item data, and a collection of the item data is work style data. The healthcare system is a healthcare system that uses the work style data to predict the judgment of items related to health checkups and stress checks for a prediction target person. and a classification data generation unit which generates initial combined data that combines the health-related combined data with the working style data for a period going back from the implementation date of the previous judgment of the items related to the health checkup and stress check of the member, the initial combined data being generated by the working style data classification unit, and which divides the initial combined data for each classification, and a classification data generation unit which generates classification data by dividing the initial combined data for each classification, and a classification data generation unit which uses judgments related to the current health checkup judgment data and stress check judgment data of the member as objective variables for each of the classification data, The system includes a teacher data generation unit that generates teacher data by setting each item data of the working style data and the judgments related to the previous health check judgment data and stress check judgment data of the member as explanatory variables, a learning unit that generates a machine learning model for predicting the objective variable for each judgment of the explanatory variables, and a prediction unit that classifies the working style data for a period going back from the date of the current judgment of items related to the health checkup and stress check of the member who is the prediction target, and prediction target data that combines the current health check judgment data and stress check judgment data of the member who is the prediction target, using the machine learning model for classification, and predicts the judgment of the items related to future health checkups and stress checks, which are the objective variables, by setting the prediction target data as explanatory variables using the machine learning model for prediction according to the classification result.
上記構成によれば、学習フェーズにおいて、働き方データを分類し、分類ごとに、予測用機械学習モデルを生成する。したがって、予測対象者の働き方に合わせた予測用機械学習モデルを使って健康にかかわる項目の判定を予測できる。これにより、予測対象者の健康にかかわる項目の判定予測を支援することができる。そして、予測フェーズにおいて、予測対象者の働きに合わせた予測用機械学習モデルを使って、当該予測対象者の健康にかかわる項目の判定を予測できるので、予測精度を向上させることができる。 According to the above configuration, in the learning phase, work style data is classified, and a predictive machine learning model is generated for each classification. Therefore, it is possible to predict the judgment of health-related items using a predictive machine learning model that matches the work style of the person to be predicted. This makes it possible to assist in predicting the judgment of items related to the health of the person to be predicted. Then, in the prediction phase, it is possible to predict the judgment of items related to the health of the person to be predicted using a predictive machine learning model that matches the work style of the person to be predicted, thereby improving prediction accuracy.
上記ヘルスケアシステムにおいて、前記働き方データ分類部は、さらに、前記働き方データにおける分類された項目データを結合した項目結合データを機械学習によって複数種類に分類し、前記分類データ生成部は、さらに、前記初期結合データにおける分類された項目データを結合した項目結合データを前記働き方データ分類部によって複数種類に分類するように構成する。 In the above-mentioned healthcare system, the work style data classification unit is further configured to classify item combination data obtained by combining the classified item data in the work style data into multiple types by machine learning, and the classified data generation unit is further configured to classify item combination data obtained by combining the classified item data in the initial combined data into multiple types by the work style data classification unit.
上記構成によれば、働き方データにおける分類された項目データを結合した項目結合データを生成し、これを分類している。項目結合データは、働き方データを構成する分類された項目データを結合したものであり、各項目の着目した分類ではなく、働き方データ全体に亘る全体的観点からの分類が可能となる。このような全体的観点を反映させた予測用機械学習モデルを使うことで、予測対象者の健康にかかわる項目の判定の予測精度を高めることができる。 According to the above configuration, item-combined data is generated by combining the classified item data in the work style data, and this data is then classified. The item-combined data is generated by combining the classified item data that constitutes the work style data, and allows classification from a holistic perspective across the entire work style data, rather than classification that focuses on each item. By using a predictive machine learning model that reflects such a holistic perspective, it is possible to improve the prediction accuracy of determining items related to the health of the person being predicted.
上記ヘルスケアシステムにおいて、前記働き方データ分類部は、前記分類ごとの特徴点を生成するように構成する。上記構成によれば、予測対象者は、自身の働き方の分類の特徴を知ることができる。 In the above-mentioned healthcare system, the work style data classification unit is configured to generate feature points for each classification. With the above-mentioned configuration, the person being predicted can know the features of the classification of his/her own work style.
上記ヘルスケアシステムにおいて、前記予測対象者の働き方データは、変更可能であり、前記予測部は、変更後の働き方データを含む前記予測対象者データを説明変数に設定して、選択された予測用機械学習モデルとは異なる前記予測用機械学習モデルを用いて、目的変数である将来の健診判定データおよびストレスチェック判定データにかかわる判定を予測するように構成する。上記構成によれば、働き方データを変更することで、現在とは異なる働き方をしたときの将来の健康にかかわる項目の判定を確認することができる。 In the above healthcare system, the working style data of the prediction target person is changeable, and the prediction unit is configured to set the prediction target person data including the changed working style data as an explanatory variable, and predict a judgment related to future health check judgment data and stress check judgment data, which are objective variables, using the predictive machine learning model different from the selected predictive machine learning model. According to the above configuration, by changing the working style data, it is possible to confirm the judgment of future health-related items when working in a different way than now.
上記ヘルスケアシステムにおいて、前記働き方データは、前記構成員ごとの出退勤履歴データを含むように構成する。上記構成によれば、働き方データに、個人ごとに、従業員個人の出勤時間データと退勤時間データといった出退勤履歴データを含めることで、労働時間の長さだけでなく、勤務時間帯も考慮して働き方データを分類することができる。 In the above-mentioned healthcare system, the working style data is configured to include attendance history data for each of the members. According to the above-mentioned configuration, by including attendance history data such as attendance time data and departure time data for each individual employee in the working style data, it is possible to classify the working style data taking into account not only the length of working hours but also the working hours.
さらに、本発明は、コンピュータを上記ヘルスケアシステムとして機能させるコンピュータプログラムである。 Furthermore, the present invention is a computer program that causes a computer to function as the above-mentioned healthcare system.
本発明によれば、構成員の健康にかかわる結果だけでなく、日常の勤怠や生活習慣に関するデータを考慮して、構成員の健康にかかわる項目の判定予測を支援できる。 The present invention can assist in predicting the outcome of health-related items for members by taking into account not only the results related to the members' health, but also data related to their daily attendance and lifestyle habits.
以下、本発明が適用されたヘルスケアシステムについて図面を参照して説明する。
〔第1実施形態〕
〔全体構成〕
本発明が適用されたヘルスケアシステムは、組織体である会社に所属する構成員である従業員のヘルスケアに供されるシステムである。そして、従業員の健康にかかわる健診やストレスチェックなどの健康関連判定データ、勤怠履歴データ、人事履歴データなどに加え、生活習慣履歴データなどを使用して、予測対象者となる各従業員の将来の健康にかかわる項目の判定を予測するシステムである。ここでは、組織体としての会社に属する構成員としての従業員のヘルスケアシステムを説明する。ここでの予測対象者は、従業員である。
Hereinafter, a health care system to which the present invention is applied will be described with reference to the drawings.
First Embodiment
[Overall structure]
The health care system to which the present invention is applied is a system provided for the health care of employees who are members belonging to a company, which is an organization. The system predicts the future health-related judgment data of each employee who is the prediction target, such as health-related judgment data of medical examinations and stress checks related to the employee's health, attendance history data, personnel history data, and lifestyle habit history data. Here, a health care system for employees who are members belonging to a company, which is an organization, is described. The prediction targets here are employees.
図1に示すように、ヘルスケアシステムは、学習用データ入力部10と、学習用データを蓄積するデータ蓄積部20とを備えている。また、予測対象者の健康状態を予測するための予測用機械学習モデルを生成するとともに予測用機械学習モデルを使用して予測対象者の健康状態を予測する学習予測処理部30と、予測用機械学習モデルを生成するためのデータを記録するモデル記録部40とを備えている。さらに、予測対象者の健康に関するデータを入力するための予測対象者用データ入力部50と、予測結果を出力する予測対象者用データ出力部60とを備えている。 As shown in FIG. 1, the healthcare system includes a learning data input unit 10 and a data storage unit 20 that stores learning data. It also includes a learning prediction processing unit 30 that generates a predictive machine learning model for predicting the health state of a prediction subject and predicts the health state of the prediction subject using the predictive machine learning model, and a model recording unit 40 that records data for generating the predictive machine learning model. It also includes a prediction subject data input unit 50 for inputting data related to the health of the prediction subject, and a prediction subject data output unit 60 that outputs the prediction result.
学習用データ入力部10は、データ蓄積部20に対して、会社に属する従業員に関する各種データを提供する。具体的に、学習用データ入力部10は、会社に所属する各従業員の健康診断判定データ(以下、「健診判定データ」という。)を入力するための健診データ入力部11と、各従業員のストレスチェック結果判定データ(以下、「ストレスチェック判定データ」という。)を入力するためのストレスチェックデータ入力部12とを備えている。さらに、各従業員の勤怠履歴データを入力するための勤怠データ入力部13と、従業員の人事履歴データを入力するための人事データ入力部14と、従業員の給与履歴データを入力するための給与データ入力部15と、従業員の生活習慣などの生活習慣履歴データを入力するための生活習慣データ入力部16とを備えている。さらに、従業員の医療履歴データを入力するための医療データ入力部17と、従業員が所属する会社の履歴データを入力するための会社データ入力部18とを備えている。 The learning data input unit 10 provides the data storage unit 20 with various data related to employees belonging to the company. Specifically, the learning data input unit 10 includes a health check data input unit 11 for inputting health checkup judgment data (hereinafter referred to as "health checkup judgment data") of each employee belonging to the company, and a stress check data input unit 12 for inputting stress check result judgment data (hereinafter referred to as "stress check judgment data") of each employee. In addition, the learning data input unit 10 includes an attendance data input unit 13 for inputting attendance history data of each employee, a personnel data input unit 14 for inputting personnel history data of the employee, a salary data input unit 15 for inputting salary history data of the employee, and a lifestyle data input unit 16 for inputting lifestyle history data such as the employee's lifestyle. In addition, the learning data input unit 10 includes a medical data input unit 17 for inputting medical history data of the employee, and a company data input unit 18 for inputting history data of the company to which the employee belongs.
健診データ入力部11、ストレスチェックデータ入力部12、勤怠データ入力部13、人事データ入力部14、給与データ入力部15、および、会社データ入力部18は、例えば、本システムのサービスの提供を受ける複数の会社の各々が管理するデータベースを備えたコンピュータである。生活習慣データ入力部16は、従業員が身体に装着されるウェアラブルデバイス端末(スマートウォッチなど)やスマートフォンなどのタブレット端末である。医療データ入力部17は、例えば従業員が管理する個人端末である。 The health check data input unit 11, stress check data input unit 12, attendance data input unit 13, personnel data input unit 14, salary data input unit 15, and company data input unit 18 are, for example, computers equipped with databases managed by each of multiple companies that receive the services of this system. The lifestyle habit data input unit 16 is a wearable device terminal (such as a smart watch) that is worn by an employee or a tablet terminal such as a smartphone. The medical data input unit 17 is, for example, a personal terminal managed by an employee.
健診データ入力部11がデータ蓄積部20に対して入力する健診判定データは、会社に所属する各従業員の「総合判定」、「メタボリックシンドローム判定」、「糖尿病判定」、「高血圧判定」、「腹囲判定」、「GPT(ALT)判定」、「GOT(AST)判定」、「肝機能障害判定」、「γ-GTP判定」、「収縮期血圧判定」、「拡張期血圧判定」、「脂質異常症判定」など、一般的な健康診断で測定され、判定される結果データである。判定については、人間ドック学会の区分やその他の医療機関が定める区分でもよい。以後、判定例としては人間ドック学会の区分A(異常なし)~E(治療中)を用いる。なお、加えて、健康診断で計測された検査値データ(体重、身長、腹囲、BMI、血圧(収縮期血圧と拡張期血圧)、尿酸、尿蛋白、LDLコレステロール、空腹時血糖、γ-GTP、GOT(AST)、GPT(ALT)といった検査値データなど)が入力されてもよい。具体的に、健診判定データは、図2のように構成される。なお、図2~図10において、企業CDは、会社を一意に特定する会社識別データであり、従業員CDは、個人識別データである。 The health checkup data input unit 11 inputs to the data storage unit 20 the health checkup assessment data, such as the "overall assessment", "metabolic syndrome assessment", "diabetes assessment", "high blood pressure assessment", "waist circumference assessment", "GPT (ALT) assessment", "GOT (AST) assessment", "liver dysfunction assessment", "γ-GTP assessment", "systolic blood pressure assessment", "diastolic blood pressure assessment", and "dyslipidemia assessment" of each employee belonging to the company, are the result data measured and assessed in a general health checkup. The assessment may be based on the classification of the Japanese Society of Health Checkups or a classification determined by other medical institutions. Hereinafter, the Japanese Society of Health Checkups' classifications A (no abnormalities) to E (under treatment) will be used as an example of the assessment. In addition, test value data measured in the health checkup (weight, height, waist circumference, BMI, blood pressure (systolic blood pressure and diastolic blood pressure), uric acid, urinary protein, LDL cholesterol, fasting blood glucose, γ-GTP, GOT (AST), GPT (ALT), and other test value data) may be input. Specifically, the health checkup assessment data is configured as shown in FIG. 2. In FIG. 2 to FIG. 10, the company CD is company identification data that uniquely identifies a company, and the employee CD is individual identification data.
ストレスチェックデータ入力部12がデータ蓄積部20に対して入力するストレスチェック判定データは、例えば、会社に所属する各従業員の職業性ストレス簡易調査票(57項目)の回答項目および因子項目の評価点、ならびに、特開2017-102673号公報に記載しているストレスチェックの分類「仕事の負担」、「仕事の仕方と目的」、「健康状態と満足度」、および、「職場環境(部署)」の判定A(良好)~E(要面談)の結果データが入力される。具体的に、ストレスチェック判定データは、図3のように構成される。 The stress check judgment data input unit 12 inputs to the data storage unit 20 includes, for example, the answer items and factor item evaluation scores of the simple occupational stress questionnaire (57 items) for each employee belonging to the company, as well as the result data of the judgments A (good) to E (interview required) for the stress check classifications "work burden," "work style and purpose," "health condition and satisfaction," and "work environment (department)" described in JP 2017-102673 A. Specifically, the stress check judgment data is configured as shown in FIG. 3.
勤怠データ入力部13がデータ蓄積部20に対して入力する勤怠履歴データは、会社に所属する各従業員の月次と日次のデータとがある。月次の勤怠履歴データは、就業時間、休憩時間、残業時間、深夜残業時間、休日出勤などのデータである。日次の勤怠履歴データは、出勤時間、退勤時間、外出開始時間、外出終了時間、休憩開始時間、休憩終了時間などのデータである。具体的に、月次の勤怠履歴データは、図4(a)のように構成され、日次の勤怠履歴データは、図4(b)のように構成される。 The attendance history data that the attendance data input unit 13 inputs into the data storage unit 20 includes monthly and daily data for each employee belonging to the company. Monthly attendance history data includes data such as working hours, break times, overtime hours, night overtime hours, and working on holidays. Daily attendance history data includes data such as arrival time at work, departure time, start time of going outside, end time of going outside, start time of break, and end time of break. Specifically, monthly attendance history data is structured as shown in Figure 4(a), and daily attendance history data is structured as shown in Figure 4(b).
人事データ入力部14がデータ蓄積部20に対して入力する人事履歴データは、会社に所属する各従業員の入社年月日、部門異動年月日、昇格の年月日などのデータである。具体的に、人事履歴データは、図5のように構成される。 The personnel history data that the personnel data input unit 14 inputs to the data storage unit 20 is data such as the date of joining the company, the date of department transfer, and the date of promotion for each employee belonging to the company. Specifically, the personnel history data is structured as shown in FIG. 5.
給与データ入力部15がデータ蓄積部に対して入力する給与履歴データは、会社に所属する各従業員の月次給与、賞与、年俸、残業手当、休日出勤手当などの給与データなどのデータである。具体的に、給与履歴データは、図6のように構成される。 The salary history data that the salary data input unit 15 inputs to the data storage unit is salary data such as monthly salary, bonus, annual salary, overtime pay, holiday work pay, etc. for each employee belonging to the company. Specifically, the salary history data is structured as shown in FIG. 6.
生活習慣データ入力部16がデータ蓄積部20に対して入力する生活習慣履歴データは、会社に所属する各従業員の歩数(一日平均)などの運動習慣、喫煙習慣(1日の本数)、飲酒回数(週平均回数)、飲酒量(1回の飲酒量)などの飲酒習慣、食事習慣(食事回数)、摂取カロリ(一日平均)、睡眠時間(一日平均)などの生活習慣にかかわるデータである。具体的に、生活習慣履歴データは、図7のように構成される。 The lifestyle history data that the lifestyle data input unit 16 inputs to the data storage unit 20 is data related to the lifestyle habits of each employee belonging to the company, such as exercise habits such as the number of steps taken (daily average), smoking habits (number of cigarettes per day), number of drinks consumed (average number per week), drinking habits such as alcohol consumption (amount drunk at one time), eating habits (number of meals), calorie intake (daily average), and sleep time (daily average). Specifically, the lifestyle history data is configured as shown in FIG. 7.
医療データ入力部17がデータ蓄積部20に対して入力する医療履歴データは、会社に所属する各従業員の治療歴データと薬歴データとがある。治療歴データは、受診年月日、医療機関名称、医師氏名、病名、治療の履歴などの履歴データであり、薬歴データは、調剤年月日、薬局名、薬品名称、調剤数量、服用方法などの履歴データである。具体的に、治療歴データは、図8のように構成され、薬歴データは、図9のように構成される。 The medical history data that the medical data input unit 17 inputs to the data storage unit 20 includes medical treatment history data and medication history data for each employee belonging to the company. The medical treatment history data is history data such as the date of consultation, name of medical institution, doctor's name, disease name, and treatment history, while the medication history data is history data such as the dispensing date, pharmacy name, drug name, dispensed quantity, and method of administration. Specifically, the medical treatment history data is structured as shown in Figure 8, and the medication history data is structured as shown in Figure 9.
会社データ入力部18がデータ蓄積部20に対して入力する会社履歴データは、従業員の所属する会社に関するデータであり、その会社が属する業種/業界、年ごとの会社規模(人数、年商、売上額、売上数量、受注額、受注数量)などのデータである。具体的に、会社履歴データは、図10のように構成される。 The company history data that the company data input unit 18 inputs to the data accumulation unit 20 is data related to the company to which the employee belongs, such as the line of business/industry to which the company belongs, and the size of the company by year (number of employees, annual turnover, sales amount, sales quantity, order amount, order quantity, etc.). Specifically, the company history data is structured as shown in FIG. 10.
データ蓄積部20は、健診データ蓄積部21と、ストレスチェックデータ蓄積部22と、勤怠データ蓄積部23と、人事データ蓄積部24と、給与データ蓄積部25と、生活習慣データ蓄積部26と、医療データ蓄積部27と、会社データ蓄積部28とを備えている。 The data storage unit 20 includes a health check data storage unit 21, a stress check data storage unit 22, an attendance data storage unit 23, a personnel data storage unit 24, a salary data storage unit 25, a lifestyle habit data storage unit 26, a medical data storage unit 27, and a company data storage unit 28.
健診データ蓄積部21には、健診データ入力部11から定期的にまたは不定期に健診判定データが入力される。ストレスチェックデータ蓄積部22には、ストレスチェックデータ入力部12から定期的にまたは不定期にストレスチェック判定データが入力される。勤怠データ蓄積部23には、勤怠データ入力部13から定期的にまたは不定期に勤怠履歴データが入力される。人事データ蓄積部24には、人事データ入力部14から定期的にまたは不定期に人事履歴データが入力される。給与データ蓄積部25には、給与データ入力部15から定期的にまたは不定期に給与履歴データが入力される。生活習慣データ蓄積部26には、生活習慣データ入力部16から定期的にまたは不定期に生活習慣履歴データが入力される。医療データ蓄積部27には、医療データ入力部17から定期的にまたは不定期に医療履歴データが入力される。会社データ蓄積部28には、会社データ入力部18から定期的にまたは不定期に会社履歴データが入力される。 The health check data storage unit 21 receives health check judgment data from the health check data input unit 11 on a regular or irregular basis. The stress check data storage unit 22 receives stress check judgment data from the stress check data input unit 12 on a regular or irregular basis. The attendance data storage unit 23 receives attendance history data from the attendance data input unit 13 on a regular or irregular basis. The personnel data storage unit 24 receives personnel history data from the personnel data input unit 14 on a regular or irregular basis. The salary data storage unit 25 receives salary history data from the salary data input unit 15 on a regular or irregular basis. The lifestyle data storage unit 26 receives lifestyle history data from the lifestyle data input unit 16 on a regular or irregular basis. The medical data storage unit 27 receives medical history data from the medical data input unit 17 on a regular or irregular basis. The company data storage unit 28 receives company history data from the company data input unit 18 on a regular or irregular basis.
各蓄積部21~28には、複数の会社や従業員のデータなどが蓄積される。データ蓄積部20の各蓄積部21~28の各データは、個人を特定する個人識別データと、個人が所属する会社の会社識別データとが付与されており、個人識別データと当該個人が所属する会社識別データとは関連付けられている。なお、蓄積されるデータは、匿名化されていてもよい。 Each of the storage units 21-28 stores data on multiple companies and employees. Each data in each of the storage units 21-28 of the data storage unit 20 is provided with personal identification data that identifies an individual and company identification data for the company to which the individual belongs, and the personal identification data is associated with the company identification data to which the individual belongs. The stored data may be anonymized.
学習予測処理部30は、予測用機械学習モデルを生成するための手段として、働き方データ生成部31と、働き方データ分類部32と、分類データ生成部33と、教師データ生成部34と、学習部35とを備える。また、予測対象者の将来の健康状態を予測する手段として、予測対象者データ生成部36と、予測部37と、予測結果出力部38とを備えている。 The learning prediction processing unit 30 includes a work style data generation unit 31, a work style data classification unit 32, a classification data generation unit 33, a teacher data generation unit 34, and a learning unit 35 as means for generating a predictive machine learning model. It also includes a prediction target data generation unit 36, a prediction unit 37, and a prediction result output unit 38 as means for predicting the future health condition of the prediction target.
モデル記録部40は、働き方データ記録部41と、特徴データ記録部42と、初期結合データ記録部43と、分類データ記録部44と、初期分類教師データ記録部45と、分類用機械学習モデル保存部47と、予測用機械学習モデル保存部48とを備えている。 The model recording unit 40 includes a working style data recording unit 41, a feature data recording unit 42, an initial binding data recording unit 43, a classification data recording unit 44, an initial classification teacher data recording unit 45, a classification machine learning model storage unit 47, and a prediction machine learning model storage unit 48.
予測対象者用データ入力部50は、予測対象者の健診判定データを入力するための健診データ入力部51と、予測対象者のストレスチェック判定データを入力するためのストレスチェックデータ入力部52とを備えている。健診データ入力部51、および、ストレスチェックデータ入力部52は、例えば、予測対象者の個人端末である。 The data input unit 50 for the prediction subject includes a health check data input unit 51 for inputting the health check judgment data of the prediction subject, and a stress check data input unit 52 for inputting the stress check judgment data of the prediction subject. The health check data input unit 51 and the stress check data input unit 52 are, for example, personal terminals of the prediction subject.
また、予測対象者用データ出力部60は、予測結果表示部61を備えている。予測結果表示部61は、予測対象者の個人端末のモニタであり、また、プリンタである。そして、予測対象者は、将来の判定を個人端末で個人ファイルを開くことによってモニタを介して見ることができ、また、プリンタで印刷された紙媒体で見ることができる。 The data output unit 60 for the person to be predicted also includes a prediction result display unit 61. The prediction result display unit 61 is a monitor of the personal terminal of the person to be predicted, and also a printer. The person to be predicted can view the future judgment via the monitor by opening a personal file on the personal terminal, and can also view it on paper media printed out by a printer.
<学習フェーズ>
ここで、図11は、学習予測処理部30が分類用機械学習モデルや予測用機械学習モデルを生成するための手順を示すフローチャートである。
<Learning Phase>
Here, FIG. 11 is a flowchart showing the procedure by which the learning prediction processing unit 30 generates a classification machine learning model and a prediction machine learning model.
ステップS1において、働き方データ生成部31は、データ蓄積部20から各種データを読み込み、ステップS2において、以下の(A)~(F)項目から構成される働き方データを生成する。なお、(A)~(C)項目は、会社に関する会社目線のデータであり、(D)~(F)項目は、従業員個人に関する個人目線のデータである。各従業員の働き方データは、(A)~(C)項目で構成される会社目線のデータと(D)~(F)項目で構成される従業員の個人目線のデータとを備えることで、従業員個人のデータと従業員が所属する会社のデータとを使った予測用機械学習モデルの生成と予測対象者の健康にかかわる項目の判定予測を可能とする。 In step S1, the work style data generation unit 31 reads various data from the data accumulation unit 20, and in step S2, generates work style data consisting of the following items (A) to (F). Items (A) to (C) are data from the company's perspective, and items (D) to (F) are data from the individual employee's perspective. The work style data for each employee includes company-perspective data consisting of items (A) to (C) and individual-perspective data for the employee consisting of items (D) to (F), making it possible to generate a predictive machine learning model using the individual employee's data and the data of the company to which the employee belongs, and to make judgment predictions for items related to the health of the person being predicted.
(A)働き方データ生成部31は、健診データ蓄積部21にアクセスして、会社ごとの各年の「メタボリックシンドローム判定」、「糖尿病判定」などに対する判定A(非常に良い)~E(非常に悪い)を読み出す。また、働き方データ生成部31は、ストレスチェックデータ蓄積部22にアクセスして、会社ごとの各年の「仕事の負担」、「仕事の仕方と目的」などに対する判定A(良好)~E(要面談)を読み出す。そして、判定A~E毎の人数比を算出し、各年の健康健診判定データおよびストレスチェック判定データを集計した健康関連判定集計データ、すなわち健康判定集計データおよびストレスチェック判定集計データを生成する。時間的範囲は、集計を行うときより前の2年から3年分である。 (A) The work style data generation unit 31 accesses the health checkup data accumulation unit 21 and reads out the judgments A (very good) to E (very bad) for "metabolic syndrome judgment," "diabetes judgment," etc. for each company and each year. The work style data generation unit 31 also accesses the stress check data accumulation unit 22 and reads out the judgments A (good) to E (requires interview) for "work burden," "work style and purpose," etc. for each company and each year. Then, the work style data generation unit 31 calculates the number of people for each judgment A to E and generates health-related judgment summary data by aggregating the health checkup judgment data and stress check judgment data for each year, i.e., health judgment summary data and stress check judgment summary data. The time range is two to three years prior to the time of aggregation.
(B)働き方データ生成部31は、勤怠データ蓄積部23、人事データ蓄積部24、および、給与データ蓄積部25にアクセスして、会社ごとの各月の平均勤務日数、平均総労働時間、平均休暇日数、人事発令の発生頻度、平均給与(月額)を算出し、勤務状況・人事にかかわる時系列データである勤怠集計データ、および、人事履歴データを生成する。時間的範囲は、集計を行うときより前の半年から1年分である(図19参照)。 (B) The work style data generation unit 31 accesses the attendance data storage unit 23, the personnel data storage unit 24, and the salary data storage unit 25 to calculate the average number of work days, average total working hours, average number of vacation days, frequency of personnel orders, and average salary (monthly) for each company each month, and generates attendance summary data, which is time-series data related to work conditions and personnel, and personnel history data. The time range is from six months to one year before the summary is made (see Figure 19).
(C)働き方データ生成部31は、給与データ蓄積部25、および、会社データ蓄積部28にアクセスし、各会社の年ごとの業種/業界、年ごとの会社規模(人数、年商、売上額、売上数量、受注額、受注数量、平均給与(年額))を算出し、会社全体にかかわる時系列データである会社履歴集計データを生成する。時間的範囲は、集計を行うときより前の2年から3年分である(図19参照)。 (C) The work style data generation unit 31 accesses the salary data accumulation unit 25 and the company data accumulation unit 28, calculates the business type/industry and company size (number of employees, annual turnover, sales amount, sales quantity, order amount, order quantity, average salary (annual amount)) for each company by year, and generates company history summary data, which is time-series data related to the entire company. The time range is two to three years prior to the time of compilation (see Figure 19).
(D)働き方データ生成部31は、勤怠データ蓄積部23にアクセスし、個人ごとの日次の出勤時間データと退勤時間データを読み出し、日時勤怠の時系列データである出退勤履歴データを生成する。時間的範囲は、健診やストレスチェックが実施された日より前の3か月から6か月である(図19参照)。 (D) The work style data generation unit 31 accesses the attendance data storage unit 23, reads out the daily attendance data and departure time data for each individual, and generates attendance history data, which is time series data of date and time attendance. The time range is three to six months prior to the date on which the health check or stress check was conducted (see FIG. 19).
(E)働き方データ生成部31は、勤怠データ蓄積部23、人事データ蓄積部24、および、給与データ蓄積部25にアクセスし、個人ごとの各月の勤務日数、総労働時間、休暇日数、人事発令の有無、平均給与(月額)のデータを読み出し、勤務状況にかかわる時系列データである勤怠履歴データを生成する。時間的範囲は、健診やストレスチェックが実施された日より前の半年から1年分である(図19参照)。 (E) The work style data generation unit 31 accesses the attendance data storage unit 23, the personnel data storage unit 24, and the salary data storage unit 25, reads out data on the number of working days for each individual person each month, total working hours, number of vacation days, whether or not personnel orders have been issued, and average salary (monthly), and generates attendance history data, which is time-series data related to working conditions. The time range is six months to one year prior to the date on which the health check or stress check was conducted (see Figure 19).
(F)働き方データ生成部31は、生活習慣データ蓄積部26、および、医療データ蓄積部27にアクセスし、個人ごとの各年および各月の歩数などの運動習慣、喫煙習慣、飲酒習慣、食事時間などの食事習慣、睡眠時間、基礎疾患の有無、入院/通院の日数、薬剤服用歴などの時系列データである生活習慣履歴データを生成する。時間的範囲は、健診やストレスチェックが実施された日より前の2年から3年分である(図19参照)。 (F) The work style data generation unit 31 accesses the lifestyle data storage unit 26 and the medical data storage unit 27, and generates lifestyle history data, which is time-series data such as exercise habits such as the number of steps taken each year and month for each individual, smoking habits, drinking habits, eating habits such as meal times, sleep hours, presence or absence of underlying diseases, number of days of hospitalization/visiting to the hospital, and medication history. The time range is two to three years prior to the date of the health check or stress check (see Figure 19).
上記(A)~(F)項でデータを取得する時間的範囲は、長期間(10年間など)にわたって過去に遡る長期間ではなく、現在の身体および精神面の健康状態に大きく影響を与える期間である。 The time range for collecting data in paragraphs (A) through (F) above is not a long period going back in time (e.g., 10 years), but a period that will have a significant impact on your current physical and mental health.
ここで、一般的に、健診やストレスチェックは、年に1度で行われていることが多い。例えば、今回が2002年だとすると前回は2001年になる。また、今回が2001年だとすると前回は2000年になる。月は、2~3か月ずれることもある。働き方データを生成するにあたっては、勤怠履歴データ、人事履歴データ、および、生活習慣履歴データを時間的範囲の重複を許容しながら取得する。すなわち、勤怠履歴データ、人事履歴データ、および、生活習慣履歴データの各々には、取得する時間的範囲が図19に示すようになっており、3か月のもの、6か月のもの、1年のもの、3年のものなどがある。項目によっては、健診やストレスチェックの実施日のずれによって、当該年の時間的範囲が前年または後年の時間的範囲と重複することが生じる。例えば、時間的範囲が1年や3年のものでは、時間的な重複がし易い、または、発生する。このような場合であっても、働き方データは、時間的範囲の重複が許容され、必要な時間的範囲の勤怠履歴データ、人事履歴データ、生活習慣履歴データなどによって生成される。 Here, generally, health checkups and stress checks are often conducted once a year. For example, if the current year is 2002, the previous year was 2001. Also, if the current year is 2001, the previous year was 2000. The month may be off by 2 to 3 months. When generating work style data, attendance history data, personnel history data, and lifestyle history data are acquired while allowing overlap in time range. That is, the attendance history data, personnel history data, and lifestyle history data each have a time range to be acquired as shown in FIG. 19, and there are three-month, six-month, one-year, three-year, and so on. Depending on the item, the time range of the year may overlap with the time range of the previous year or the following year due to the difference in the implementation date of the health checkup or stress check. For example, if the time range is one year or three years, time overlap is likely to occur or occurs. Even in such cases, overlapping time ranges are permitted, and work style data is generated from attendance history data, personnel history data, lifestyle history data, etc., for the required time range.
ステップS3において、働き方データ分類部32は、上記(A)~(F)項の各項目データをK-Meansなどの機械学習によって、クラスタ分類(グループ化)を行う。分類数は、特に限定されるものではないが、一例として、従業員などが違いを認識できる程度の数が目安であり、ここでは4種としている。これにより、上記(A)~(F)項の6項目について、4種の分類(合計24種類)が作成される。図12は、上記(A)項のデータの分類を示している。図12(a)に示すように、働き方データ生成部31が生成したデータは、会社ごとに、時系列に、健診の判定A~判定Eが時系列に並べられている。そして、働き方データ分類部32は、図12(a)のデータを「1」~「4」に分類する。図12(b)は、分類後の分類「1」を示し、図12(c)は、分類後の分類「4」を示す。 In step S3, the work style data classification unit 32 performs cluster classification (grouping) on each item data of the above items (A) to (F) using machine learning such as K-Means. The number of classifications is not particularly limited, but as an example, a number that allows employees to recognize the differences is a guideline, and here it is set to four types. As a result, four types of classifications (24 types in total) are created for the six items of the above items (A) to (F). Figure 12 shows the classification of the data of the above item (A). As shown in Figure 12 (a), the data generated by the work style data generation unit 31 is arranged in chronological order for each company, with the health checkup judgments A to E in chronological order. Then, the work style data classification unit 32 classifies the data of Figure 12 (a) into "1" to "4". Figure 12 (b) shows classification "1" after classification, and Figure 12 (c) shows classification "4" after classification.
ステップS4において、働き方データ分類部32は、働き方データの6項目(A)~(F)×4種(分類1~4)を組み合わせた項目結合データ(G)項の項目結合データを生成し、これをさらにK-meansなどの機械学習によってクラスタ分類を行う。図13は、(G)項の項目結合データを示し、(a)は、(A)~(F)項で分類したデータを組み合わせたデータを示す。図13(b)は、分類後の分類「1」を示し、図13(c)は、分類後の分類「4」を示す。これにより、計7項目((A)~(G))×4種(「1」~「4」)の分類が行われる。働き方データ分類部32は、機械学習により学習された分類用機械学習モデルを分類用機械学習モデル保存部47に保存する。(A)~(F)項の各項の分類は、各項の定義に従った個別視点の分類であり、(G)項の分類は、(A)~(F)項の個々では現れない(A)~(F)項を合わせた全体的観点からの分類である。 In step S4, the work style data classification unit 32 generates item combination data of item combination data (G) combining six items (A) to (F) x four types (classifications 1 to 4) of the work style data, and further performs cluster classification using machine learning such as K-means. Figure 13 shows the item combination data of the (G) item, and (a) shows data combining data classified by items (A) to (F). Figure 13 (b) shows classification "1" after classification, and Figure 13 (c) shows classification "4" after classification. This results in a total of seven items ((A) to (G)) x four types ("1" to "4"). The work style data classification unit 32 stores the classification machine learning model learned by machine learning in the classification machine learning model storage unit 47. The classification of items (A) through (F) is a classification from an individual perspective according to the definition of each item, and the classification of item (G) is a classification from a holistic perspective that combines items (A) through (F) that do not appear individually in items (A) through (F).
ステップS5において、働き方データ分類部32は、(A)~(G)の7項×4種の分類における特徴点を抽出する。具体的に、働き方データ分類部32は、(A)~(G)の項目毎に、4種の分類を実施し、その4種の分類の各説明変数のパラメータを平均化する(図14(a)参照)。そして、各分類の説明変数の値と、平均値との差を算出し、差が大きい説明変数を各分類の特徴点とする(図14(b)および(c)参照)。そして、働き方データ分類部32は、各分類の特徴点のデータを、特徴データ記録部42に保存する。 In step S5, the work style data classification unit 32 extracts feature points in the seven items x four classifications (A) to (G). Specifically, the work style data classification unit 32 performs four classifications for each of the items (A) to (G) and averages the parameters of the explanatory variables of the four classifications (see FIG. 14(a)). Then, the difference between the value of the explanatory variable of each classification and the average value is calculated, and the explanatory variable with the largest difference is set as the feature point of each classification (see FIGS. 14(b) and (c)). The work style data classification unit 32 then stores data on the feature points of each classification in the feature data recording unit 42.
すなわち、ステップS4およびステップS5をまとめると、図15に示すように、学習フェーズにおいて、働き方データ分類部32が上記(A)~(F)項の各々について、例えば4つに分類し、さらに、(A)~(F)項を組み合わせた(G)項の項目結合データについて、例えば4つに分類する。そして、分類用機械学習モデルを分類用機械学習モデル保存部47に保存する。また、ステップS5で(A)~(G)の各々の「1」~「4」の各分類の特徴点を特徴データ記録部42に保存する。 In other words, to summarize steps S4 and S5, as shown in FIG. 15, in the learning phase, the work style data classification unit 32 classifies each of the above items (A) to (F) into, for example, four categories, and further classifies the item combination data of item (G) which combines items (A) to (F) into, for example, four categories. The classification machine learning model is then stored in the classification machine learning model storage unit 47. Also, in step S5, the feature points of each of the categories "1" to "4" for each of (A) to (G) are stored in the feature data recording unit 42.
以上は、分類用機械学習モデルを生成するための処理であり、以下は、予測用機械学習モデルを生成するための処理である。
ステップS6において、分類データ生成部33は、個人ごとの、健診やストレスチェックが実施された実施日をもとに、今回と前回の2回分の健診判定データとストレスチェック判定データとを結合した健康関連結合データを生成する(図16参照)。そして、例えば、ここ1年間の健康状態の傾向を把握するため、前回の健診をもとに、今回の健診の結果を結合する。
The above is the process for generating a machine learning model for classification, and the following is the process for generating a machine learning model for prediction.
In step S6, the classified data generating unit 33 generates health-related combined data by combining the current and previous health check assessment data and the stress check assessment data based on the implementation dates of the health check and stress check for each individual (see FIG. 16). Then, in order to grasp the trend of the health condition over the past year, for example, the results of the current health check are combined with those of the previous health check.
ステップS7において、分類データ生成部33は、個人ごとの前回の健診やストレスチェックが実施された実施日を起点にして、(A)~(F)から構成される働き方データを生成し(図17参照)、この働き方データに、ステップS6で生成した健康関連結合データを結合する。または、ステップS2で生成した働き方データに健康関連結合データを結合する。これにより、働き方データと、前回の健診判定データとストレスチェック判定データと、今回の健診判定データとストレスチェック判定データとが結合された初期結合データが生成される(図18参照)。ステップS8において、働き方データ生成部31は、初期結合データを、初期結合データ記録部43に保存する。働き方データを取得する時間的範囲は、図19の通りである。 In step S7, the classification data generation unit 33 generates working style data consisting of (A) to (F) starting from the implementation date of the previous health check or stress check for each individual (see FIG. 17), and combines this working style data with the health-related combined data generated in step S6. Alternatively, the health-related combined data is combined with the working style data generated in step S2. This generates initial combined data in which the working style data, the previous health check assessment data and stress check assessment data, and the current health check assessment data and stress check assessment data are combined (see FIG. 18). In step S8, the working style data generation unit 31 saves the initial combined data in the initial combined data recording unit 43. The time range for obtaining working style data is as shown in FIG. 19.
ステップS9において、分類データ生成部33は、初期結合データに対して、ステップS4で生成した分類用機械学習モデルを使って分類を行う。ここでの分類数は、ステップS3と同じく4つである。さらに、働き方データ分類部32は、働き方データの6項目(A)~(F)×4種(分類1~4)のデータを組み合わせた(G)項の項目結合データを生成し(図20(a)参照)、これをさらにステップS4で生成した分類用機械学習モデルを使って分類を行い、分類ごとに初期結合データを分割する(図20(b),(c)参照)。これにより、計7項目((A)~(G))×4種(「1」~「4」)の分類データを生成できる。分類データ生成部33は、分類用機械学習モデルにより得られた分類データを分類データ記録部44に保存する。 In step S9, the classification data generation unit 33 classifies the initial combined data using the machine learning model for classification generated in step S4. The number of categories here is four, the same as in step S3. Furthermore, the work style data classification unit 32 generates item combined data of item (G) by combining data of six items (A) to (F) x four types (categories 1 to 4) of work style data (see FIG. 20(a)), which is further classified using the machine learning model for classification generated in step S4, and divides the initial combined data for each category (see FIGS. 20(b) and 20(c)). This allows the generation of classified data of a total of seven items ((A) to (G)) x four types ("1" to "4"). The classified data generation unit 33 stores the classified data obtained by the machine learning model for classification in the classified data recording unit 44.
ステップS10において、教師データ生成部34は、分類データごとに、目的変数を、今回の健診の「総合判定」、および、今回のストレスチェックの「仕事の負担」、「仕事の仕方と目的」、「健康状態と満足度」、「職場環境(部署)」の各判定に設定する。そして、説明変数を、前回の「健診判定データ」と前回の「ストレスチェック判定データ」に設定する。これにより、初期分類教師データが生成され、初期分類教師データが初期分類教師データ記録部45に保存される。このときの目的変数の値は、判定「A」~「E」となる。ここでの健診における目的変数は、血圧や血糖値などの判定でもよいが、ここでは、「総合判定」にしている。また、ストレスチェックの判定もこれに限定されるものではない。 In step S10, the teacher data generation unit 34 sets the objective variables for each classification data to the "overall judgment" of the current health check, and each judgment of the current stress check: "work burden," "work style and purpose," "health condition and satisfaction," and "work environment (department)." The explanatory variables are then set to the previous "health check judgment data" and the previous "stress check judgment data." This generates initial classification teacher data, which is then stored in the initial classification teacher data recording unit 45. The objective variable value at this time is judgment "A" to "E." The objective variable for the health check here may be a judgment of blood pressure, blood sugar level, etc., but here it is set to "overall judgment." Furthermore, the judgment of the stress check is not limited to this.
ステップS11において、教師データ生成部34は、偏った教師データが生成されることを抑制するため、以下の(1)~(3)の条件に従って教師データを生成する。具体的には、次のように初期分類教師データから教師データを生成する。 In step S11, the teacher data generation unit 34 generates teacher data according to the following conditions (1) to (3) in order to prevent biased teacher data from being generated. Specifically, teacher data is generated from the initial classification teacher data as follows.
(1)先ず、教師データ生成部34は、目的変数側の判定(今回の健診の「総合判定」、および、今回のストレスチェックの「仕事の負担」、「仕事の仕方と目的」、「健康状態と満足度」、「職場環境(部署)」)の値ごとに、説明変数(「働き方データ」、および、前回の「健診判定データ」と前回の「ストレスチェック判定データ」)のデータ量を揃えた教師データを作成する。 (1) First, the teacher data generation unit 34 creates teacher data with consistent amounts of data for the explanatory variables ("work style data," and the previous "health check judgment data" and previous "stress check judgment data") for each value of the objective variable judgment (the current health check's "overall judgment," and the current stress check's "work burden," "work style and purpose," "health condition and satisfaction," and "work environment (department)").
例えば、今回の健診の「総合判定」の予測の場合であって、説明変数側の前回の健診の「総合判定」の結果の人数が、
A判定:50人、B判定:200人、C判定:300人、D判定:70人、E判定:20人
の場合を説明する。この場合、以下の(a)~(e)の教師データを生成する。
For example, in the case of predicting the "overall judgment" of the current health check, the number of people whose "overall judgment" of the previous health check on the explanatory variable side is
A case will be described in which 50 people are graded A, 200 people are graded B, 300 people are graded C, 70 people are graded D, and 20 people are graded E. In this case, the following teacher data (a) to (e) are generated.
(a)A判定で人数を揃える。
A判定:50人、B判定:50人、C判定:50人、D判定:50人、E判定:20人
(a) Ensure that the number of participants is equal to A.
A judgment: 50 people, B judgment: 50 people, C judgment: 50 people, D judgment: 50 people, E judgment: 20 people
(b)B判定で人数を揃える。
A判定:50人、B判定:200人、C判定:200人、D判定:70人、E判定:20人
(b) The number of people is equalized by B judgment.
A rating: 50 people, B rating: 200 people, C rating: 200 people, D rating: 70 people, E rating: 20 people
(c)C判定で人数を揃える。この場合、全データをそのまま使用するので同じになる。
A判定:50人、B判定:200人、C判定:300人、D判定:70人、E判定:20人
(c) The number of people is made uniform by C judgment. In this case, all data is used as is, so the results are the same.
A rating: 50 people, B rating: 200 people, C rating: 300 people, D rating: 70 people, E rating: 20 people
(d)D判定で人数を揃える。
A判定:50人、B判定:70人、C判定:70人、D判定:70人、E判定:20人
(e)E判定で人数を揃える。この場合、全データが同じ量になる。
A判定:20人、B判定:20人、C判定:20人、D判定:20人、E判定:20人
(d) Ensure that the number of participants is equal by D rating.
A grade: 50 people, B grade: 70 people, C grade: 70 people, D grade: 70 people, E grade: 20 people (e) The number of people is made uniform at E grade. In this case, all data will be the same amount.
A judgment: 20 people, B judgment: 20 people, C judgment: 20 people, D judgment: 20 people, E judgment: 20 people
(1)では、(a)~(e)の各々の条件で教師データを生成する。
(2)次いで、教師データ生成部34は、上記(1)のデータに対して、PCA(Principal Correlation Analysis)、KPCA(Kernel PCA)、ISOMAP(Isometric Mapping)といった主成分分析を行った教師データを生成する。すなわち(1)の教師データに対して絞り込みを行った教師データとなる。
なお、主成分分析以外の方法で教師データを生成してもよい。
In (1), training data is generated under each of the conditions (a) to (e).
(2) Next, the teacher data generation unit 34 generates teacher data by performing principal component analysis such as PCA (Principal Correlation Analysis), KPCA (Kernel PCA), and ISOMAP (Isometric Mapping) on the data in (1) above. In other words, this is teacher data that has been narrowed down from the teacher data in (1).
The training data may be generated using a method other than the principal component analysis.
(3)教師データ生成部34は、上記(1)のデータに対して、上記(2)の主成分分析を行った教師データを新たな説明変数として加えた教師データを生成する。 (3) The teacher data generation unit 34 generates teacher data by adding the teacher data obtained by performing the principal component analysis described above in (2) to the data described above in (1) as new explanatory variables.
ステップS12において、教師データ生成部34はステップ11で作成した各教師データに対して、量にして10~50%未満のデータを検証データとして分離する。
ステップS13において、教師データ生成部34は、上記(1)~(3)で生成した教師データを教師データ記録部46に保存する。
In step S12, the teacher data generating unit 34 separates data that is less than 10% to 50% in terms of amount from each teacher data created in step S11 as verification data.
In step S13, the teacher data generating unit 34 stores the teacher data generated in the above steps (1) to (3) in the teacher data recording unit 46.
ステップS14において、学習部35は、ステップS11で生成した上記(1)~(3)の教師データに対して複数の機械学習アルゴリズムでの学習を行い複数の予測用機械学習モデルを作成する。 In step S14, the learning unit 35 performs learning using multiple machine learning algorithms on the training data (1) to (3) generated in step S11 to create multiple predictive machine learning models.
ステップS15において、ステップS14にて生成した複数の予測用機械学習モデルに対して、学習部35は、ステップ12で生成した検証データを使用し、説明変数の判定ごとに、目的変数の予測を行う。そして、学習部35は、その予測が検証データの目的変数に対して正解する比率「正解率」を測定する。次に、この複数の予測用機械学習モデルを組み合わせて予測させ、組み合わせの中で多数決を行った場合の予測の正解率を測定する。この予測用機械学習の組み合わせも複数作成し、正解率を測定しておく。そして、これらの正解率の中から最も高い正解率の単一の予測用機械学習モデルもしくは予測用機械学習モデルの組み合わせを予測用機械学習モデルとして選択し、ステップS16において、学習部35は、その予測用機械学習モデルを予測用機械学習モデル保存部48に保存する。学習部35は、健診の「総合判定」、および、ストレスチェックの「仕事の負担」、「仕事の仕方と目的」、「健康状態と満足度」、「職場環境(部署)」の計5種類について予測用機械学習モデルを生成する。 In step S15, the learning unit 35 uses the validation data generated in step S12 to predict the objective variable for each judgment of the explanatory variable for the multiple predictive machine learning models generated in step S14. The learning unit 35 then measures the "correct answer rate", which is the ratio at which the prediction is correct for the objective variable of the validation data. Next, the multiple predictive machine learning models are combined to make a prediction, and the correct answer rate of the prediction when a majority vote is taken among the combinations is measured. Multiple combinations of the predictive machine learning models are also created, and the correct answer rate is measured. Then, from among these correct answer rates, a single predictive machine learning model or a combination of predictive machine learning models with the highest correct answer rate is selected as the predictive machine learning model, and in step S16, the learning unit 35 stores the predictive machine learning model in the predictive machine learning model storage unit 48. The learning unit 35 generates predictive machine learning models for a total of five types, namely, the "overall judgment" of the health check, and the "work burden", "work style and purpose", "health condition and satisfaction", and "work environment (department)" of the stress check.
なお、単一の予測学習モデルおよび予測用機械学習モデルの組み合わせから選択する値は正解率だけではなく、目的変数の値ごとに予測した値がどれくらい正解するかの比率を示す「適合率」、目的変数の値の中で正解した比率を示す「再現率」、機械学習の評価指標である「F値」であってもよい。また、予測用機械学習モデルの組み合わせによる予測の決定方法は多数決だけではなく、平均や加重平均、調和平均などであってもよい。 The value selected from the combination of a single predictive learning model and a predictive machine learning model is not limited to the accuracy rate, but may be the "precision rate" indicating the proportion of correct predicted values for each value of the objective variable, the "recall rate" indicating the proportion of correct answers among the values of the objective variable, or the "F-score" which is an evaluation index for machine learning. Furthermore, the method of determining predictions by combining predictive machine learning models is not limited to majority voting, and may be the average, weighted average, harmonic mean, etc.
以上のような学習フェーズでは、図21に示すように、まず、分類用機械学習モデルを生成する。そして、初期結合データを予測用機械学習モデルで分類し、分類ごとに、目的変数に今回の健診の「総合判定」などを設定し、説明変数に前回の「健診判定データ」などを設定して教師データを生成し、学習処理を行って複数の予測用機械学習モデルを生成する。 In the above learning phase, as shown in FIG. 21, first, a classification machine learning model is generated. Then, the initial combined data is classified using the prediction machine learning model, and for each classification, the "overall judgment" of the current health check is set as the objective variable, and the previous "health check judgment data" is set as the explanatory variable to generate teacher data, and a learning process is performed to generate multiple prediction machine learning models.
<予測フェーズ>
次に、予測対象者である従業員の健康に関する将来(例えば今回の健診やストレスチェックが実施された実施日から1年後)の判定を予測するための手順を図22を参照して説明する。
<Prediction Phase>
Next, a procedure for predicting a future judgment regarding the health of an employee who is the subject of prediction (for example, one year after the date of the current health check or stress check) will be described with reference to FIG. 22.
ステップS21において、働き方データ生成部31は、データ蓄積部20からデータ読み出す。なお、データ読み出し前に、従業員である予測対象者は、予測対象者用データ入力部50から今回の健診判定データ、及び、今回のストレスチェック判定データを入力し、予測対象者用データ入力部50は当該入力データをデータ蓄積部20に保存する。 In step S21, the work style data generation unit 31 reads data from the data accumulation unit 20. Before the data is read, the employee who is the prediction target inputs the current health check assessment data and the current stress check assessment data from the prediction target data input unit 50, and the prediction target data input unit 50 stores the input data in the data accumulation unit 20.
ステップS22において、予測対象者データ生成部36は、予測対象者の今回の健診やストレスチェックが実施された実施日を起点にして、(A)~(F)項から構成される働き方データを生成する。働き方データを取得する時間的範囲は、図19の通りである。ここでの働き方データは、(A)~(C)項については、個人識別データおよび会社識別データで特定される予測対象者が所属する会社のデータであり、(D)~(F)は、個人識別データで特定される当該予測対象者のデータである。 In step S22, the predicted target data generation unit 36 generates working style data consisting of items (A) to (F) starting from the implementation date of the predicted target's current health check or stress check. The time range for acquiring the working style data is as shown in FIG. 19. Here, the working style data (A) to (C) is data on the company to which the predicted target identified by the personal identification data and company identification data belongs, and (D) to (F) is data on the predicted target identified by the personal identification data.
ステップS23において、予測対象者データ生成部36は、ステップS22で生成した働き方データに、予測対象者の今回の健診判定データとストレスチェック判定データとを結合した予測対象者データを生成する。 In step S23, the predicted subject data generation unit 36 generates predicted subject data by combining the work style data generated in step S22 with the current health check assessment data and stress check assessment data of the predicted subject.
ステップS24において、予測対象者データ生成部36は、予測対象者データを予測部37に入力する。ステップS25において、予測部37は、予測対象者データの(A)~(G)項の各々を分類用機械学習モデルを使用し、「1」~「4」に分類する。また、働き方データの6項目(A)~(F)×4種(分類1~4)のデータを組み合わせた(G)項の項目結合データを生成する。 In step S24, the predicted target data generation unit 36 inputs the predicted target data to the prediction unit 37. In step S25, the prediction unit 37 classifies each of the items (A) to (G) of the predicted target data into "1" to "4" using a machine learning model for classification. In addition, it generates item combination data for item (G) that combines data from the six items (A) to (F) x four types (classifications 1 to 4) of work style data.
そして、予測部37は、予測対象者の働き方データの分類および予測対象者の今回の健診の「総合判定」、および、ストレスチェックの「仕事の負担」、「仕事の仕方と目的」、「健康状態と満足度」、「職場環境(部署)」の判定に応じて、使用する予測用機械学習モデルを選択し、例えば今回の健診やストレスチェックが実施された実施日から1年後の予測を実行する。予測結果出力部38は、予測結果表示部61に予測結果を出力する。これらの予測は、健診の「総合判定」、および、ストレスチェックの「仕事の負担」、「仕事の仕方と目的」、「健康状態と満足度」、「職場環境(部署)」という5種類の目的変数ごとに実施される。 The prediction unit 37 then selects a machine learning model for prediction to use depending on the classification of the work style data of the prediction target person and the "overall judgment" of the prediction target person's current health check, and the judgments of the "work burden," "work style and purpose," "health condition and satisfaction," and "work environment (department)" of the stress check, and performs a prediction, for example, one year from the implementation date of the current health check or stress check. The prediction result output unit 38 outputs the prediction results to the prediction result display unit 61. These predictions are performed for five types of objective variables: the "overall judgment" of the health check, and the "work burden," "work style and purpose," "health condition and satisfaction," and "work environment (department)" of the stress check.
すなわち、図23に示すように、予測フェーズにおいて、予測対象者データ生成部36が予測対象者の今回の健診やストレスチェックが実施された実施日を起点にして、(A)~(F)項から構成される働き方データに、(G)項を加え、予測対象者の今回の健診判定データとストレスチェック判定データとを結合した予測対象者データを生成する。そして、働き方データ分類部32が予測対象者データの(A)~(G)項の各々を分類する。そして、図24は、健診の「総合判定」の場合を示す。今回の健診の「総合判定」がA判定の場合、A判定の場合用の予測用機械学習モデルを用いて予測し、将来の健診の「総合判定」を予測する。その後、ステップS26において、予測結果出力部38は、予測結果表示部61に出力する。 That is, as shown in FIG. 23, in the prediction phase, the predicted subject data generation unit 36 adds item (G) to the work style data consisting of items (A) to (F) starting from the implementation date of the current health check and stress check of the predicted subject, and generates predicted subject data that combines the current health check judgment data and stress check judgment data of the predicted subject. Then, the work style data classification unit 32 classifies each of the items (A) to (G) of the predicted subject data. Then, FIG. 24 shows the case of the "overall judgment" of the health check. If the "overall judgment" of the current health check is judgment A, a prediction is made using a predictive machine learning model for the case of judgment A, and the "overall judgment" of the future health check is predicted. Then, in step S26, the prediction result output unit 38 outputs to the prediction result display unit 61.
図25は、予測結果表示部61での予測結果の表示例を示す。予測結果では、予測対象者の将来の「健診の総合判定」、および、ストレスチェックの「仕事の負担」、「仕事の仕方と目的」、「健康状態と満足度」、「職場環境(部署)」について、判定が示される。 Figure 25 shows an example of the display of prediction results in the prediction result display unit 61. The prediction results show the prediction target's future "overall health checkup judgment," as well as judgments for the stress check's "work burden," "work style and purpose," "health condition and satisfaction," and "work environment (department)."
ところで、予測部37は、予測対象者などの操作者は、予測対象者の本来の分類とは異なる働き方データおよび/または予測用機械学習モデルを使って予測を行うこともできる。例えば、将来、予測対象者が昇進や部署移動などで職場環境などが変わった場合を想定し、現職場環境から想定職場環境に変化したときの「健診の総合判定」、および、ストレスチェックの「仕事の負担」、「仕事の仕方と目的」、「健康状態と満足度」、「職場環境(部署)」を予測することができる。 Incidentally, the prediction unit 37 can also make predictions using work style data and/or predictive machine learning models that are different from the original classification of the prediction target, such as the operator of the prediction target. For example, assuming that the prediction target will have a change in the workplace environment in the future due to promotion or transfer to another department, it can predict the "overall health checkup judgment" and the stress check's "work burden," "work style and purpose," "health condition and satisfaction," and "work environment (department)" when the workplace environment changes from the current workplace to the assumed workplace environment.
図26に示すように、ステップS31において、働き方データ生成部31は、データ蓄積部20から予測対象者の今回の健診判定データおよびストレスチェック判定データを読み出す。ステップS32において、予測対象者データ生成部36は、予測対象者の今回の健診やストレスチェックが実施された実施日を起点にして、(A)~(F)項から構成される働き方データを生成する。 As shown in FIG. 26, in step S31, the work style data generation unit 31 reads out the current health check assessment data and stress check assessment data of the prediction target from the data storage unit 20. In step S32, the prediction target data generation unit 36 generates work style data consisting of items (A) to (F) starting from the implementation date on which the prediction target's current health check and stress check were implemented.
ステップS33において、予測対象者データ生成部36は、予測対象者の働き方データの(A)~(G)項の各々を分類用機械学習モデルに従って、「1」~「4」に分類する。また、働き方データの6項目(A)~(F)×4種(分類1~4)のデータを組み合わせた(G)項の項目結合データを生成し分類する。 In step S33, the predicted target data generation unit 36 classifies each of the items (A) to (G) of the work style data of the predicted target into "1" to "4" according to the machine learning model for classification. It also generates and classifies item combination data for item (G) that combines data on six items (A) to (F) of work style data x four types (classifications 1 to 4).
ステップS34において、予測対象者データ生成部36は、予測対象者の働き方データに今回の健診判定データとストレスチェック判定データとを結合した予測対象者データを生成する。この際、働き方データには、予測対象者の働き方データとは異なるデータを設定する。例えば、昇進や部署移動したときの働き方データを設定する。具体的に項目(D)~(F)のデータを変更する。 In step S34, the predicted target data generation unit 36 generates predicted target data by combining the current health check assessment data and stress check assessment data with the working style data of the predicted target. At this time, the working style data is set to data different from the working style data of the predicted target. For example, working style data when promoted or transferred to another department is set. Specifically, the data in items (D) to (F) is changed.
ステップS35において、予測対象者データ生成部36は、変更後の予測対象者データを予測部37に入力する。ステップS36において、予測部37は、予測対象者データの(A)~(G)項の各々を分類用機械学習モデルに従って、「1」~「4」に分類する。また、働き方データの6項目(A)~(F)×4種(分類1~4)のデータを組み合わせた(G)項の項目結合データを生成する。そして、予測部37は、予測対象者の働き方データの分類および予測対象者の今回の健診の「総合判定」、および、ストレスチェックの「仕事の負担」、「仕事の仕方と目的」、「健康状態と満足度」、「職場環境(部署)」の判定に応じて、使用する予測用機械学習モデルを選択し、例えば今回の健診やストレスチェックが実施された実施日から1年後の予測を実行する。 In step S35, the predicted subject data generation unit 36 inputs the changed predicted subject data to the prediction unit 37. In step S36, the prediction unit 37 classifies each of the items (A) to (G) of the predicted subject data into "1" to "4" according to the classification machine learning model. In addition, the prediction unit 37 generates item combination data for item (G) that combines data of six items (A) to (F) x four types (classifications 1 to 4) of work style data. The prediction unit 37 then selects a predictive machine learning model to use according to the classification of the work style data of the predicted subject and the "overall judgment" of the predicted subject's current health check, and the judgment of the "work burden," "work style and purpose," "health condition and satisfaction," and "work environment (department)" of the stress check, and performs a prediction, for example, one year after the implementation date of the current health check or stress check.
予測結果出力部38は、予測結果表示部61に予測結果を出力する。これらの予測は、健診の「総合判定」、および、ストレスチェックの「仕事の負担」、「仕事の仕方と目的」、「健康状態と満足度」、「職場環境(部署)」という5種類の目的変数ごとに実施される。なお、これらすべての項目について予測を行わなくてもよく、予測対象者が希望する項目だけを予測してもよい。 The prediction result output unit 38 outputs the prediction results to the prediction result display unit 61. These predictions are made for five types of objective variables: the "overall assessment" of the health check, and the "work burden," "work style and purpose," "health condition and satisfaction," and "work environment (department)" of the stress check. Note that it is not necessary to make predictions for all of these items, and it is possible to predict only the items desired by the person being predicted.
その後、ステップS37において、予測結果出力部38は、予測結果表示部61に出力する。予測結果では、予測対象者の将来の「健診の総合判定」、および、ストレスチェックの「仕事の負担」、「仕事の仕方と目的」、「健康状態と満足度」、「職場環境(部署)」について、判定結果が示される。 Then, in step S37, the prediction result output unit 38 outputs to the prediction result display unit 61. The prediction result shows the future "overall health checkup assessment" of the person being predicted, as well as the assessment results for the "work burden," "work style and purpose," "health condition and satisfaction," and "work environment (department)" of the stress check.
すなわち、図27に示すように、予測部37は、働き方データを変更することで、予測用機械学習モデルを図24の場合と異なる予測用機械学習モデルを使って、変更した働き方データに応じた予測結果を得ることもできる。一例として、図23では健診の「総合判定」においてA判定が選択されているが、働き方データを変更することで、D判定となる場合がある。この際、予測対象者は、D判定になる場合の働き方データを把握することで、どのような働き方をするとD判定になるかを示すことができる。 That is, as shown in FIG. 27, by changing the working style data, the prediction unit 37 can use a different predictive machine learning model than that in FIG. 24 to obtain a prediction result according to the changed working style data. As an example, in FIG. 23, an A rating is selected in the "overall rating" of the health check, but by changing the working style data, a D rating may be obtained. In this case, the person to be predicted can indicate what kind of working style will result in a D rating by understanding the working style data that would result in a D rating.
上記ヘルスケアシステムによれば、以下に列挙する効果を得ることができる。
(1)予測対象者の働き方に合わせた予測用機械学習モデルを使って、当該予測対象者の健康診断およびストレスチェックにかかわる項目の判定を予測できる。これにより、予測対象者の健康にかかわる項目の判定を支援することができる。
According to the above-described healthcare system, the following effects can be obtained.
(1) Using a predictive machine learning model tailored to the working style of the person being predicted, it is possible to predict the outcome of health checkups and stress checks for that person, thereby helping to determine the outcome of health-related items for that person.
これまで、産業医/保健師が指導/面談を実施する従業員を選定する際は、従業員の現在の判定を元に実施していたが、本システムにより将来の予測が行えるので、現在は良いが将来悪くなる人の面談を行うという使い方で、産業医/保健師の支援ができる。 Until now, when industrial physicians/public health nurses selected employees for guidance/interviews, they did so based on the employee's current assessment, but this system makes it possible to make future predictions, so it can be used to support industrial physicians/public health nurses by interviewing people who are doing well now but who may deteriorate in the future.
(2)学習フェーズにおいて、働き方データを分類し、分類ごとの予測用機械学習モデルを生成することができる。これにより、予測フェーズにおいて、予測対象者の働き方に合わせた予測用機械学習モデルを使って健康診断およびストレスチェックにかかわる項目の判定を予測できるので、予測精度を向上させることができる。 (2) In the learning phase, work style data can be classified and a predictive machine learning model can be generated for each classification. As a result, in the prediction phase, the results of items related to health checkups and stress checks can be predicted using a predictive machine learning model that is tailored to the work style of the person being predicted, thereby improving prediction accuracy.
(3)予測対象者の健診結果の判定やストレスチェックの判定を予測することができる。すなわち、予測対象者の身体面と精神面からの健康を予測することができる。
(4)働き方データは、(A)~(C)項の会社に関する会社目線のデータと(D)~(F)項の従業員個人に関する個人目線のデータを含むことで、様々な要素を考慮に入れて、従業員の健康診断およびストレスチェックにかかわる項目の判定を予測できる。さらに、働き方データの中に(C)を含ませることで、所属する会社や業界の業績なども考慮に入れて従業員の健康診断およびストレスチェックにかかわる項目の判定を予測できる。
(3) It is possible to predict the results of a health checkup and a stress check of a person to be predicted, i.e., it is possible to predict the physical and mental health of a person to be predicted.
(4) The work style data includes data from the company's perspective (A) to (C) and data from the individual's perspective (D) to (F), which allows for prediction of the results of items related to employee health checkups and stress checks by taking into account various factors. Furthermore, by including (C) in the work style data, it is possible to predict the results of items related to employee health checkups and stress checks by taking into account the performance of the company and industry to which the employee belongs.
(5)働き方データにおける分類された項目データを結合した項目結合データを生成し((G)項)、これを分類している。項目結合データは、働き方データを構成する分類された項目データを結合したものであり、項目の着目した分類ではなく、働き方データ全体に亘る全体的観点(業界や各組織の働き方の傾向など)からの分類となる。したがって、このような全体的観点を反映させた予測用機械学習モデルを使うことで、予測対象者の健康にかかわる項目の判定の予測精度を高めることができる。 (5) Item-combined data is generated by combining the classified item data in the work style data (section (G)), and this data is classified. The item-combined data is a combination of the classified item data that make up the work style data, and is a classification from a holistic perspective across the entire work style data (such as trends in work styles in industries or at each organization), rather than a classification focused on an item. Therefore, by using a predictive machine learning model that reflects such a holistic perspective, it is possible to improve the accuracy of predictions for items related to the health of the person being predicted.
(6)予測対象者は、自身の働き方データの分類の特徴を知ることができる。
(7)予測用機械学習モデルを変更することで、どのような働き方をすると、将来の健康にかかわる項目の判定が悪化したり、改善されるかを把握することができる。この際に、特徴データを、働き方データの変更後の分類に応じて、どのような働き方だと健康にかかわる項目が改善するのか、悪化するのかを説明の参考にすることができる。
(6) The person being predicted can learn the characteristics of the classification of their own work style data.
(7) By changing the predictive machine learning model, it is possible to understand what kind of work style will worsen or improve the assessment of future health-related items. At this time, the feature data can be used as a reference for explaining what kind of work style will improve or worsen the health-related items according to the classification after the change in the work style data.
(8)働き方データに、個人ごとに、従業員個人の出勤時間データと退勤時間データといった出退勤履歴データ((D)項)を含めることで、労働時間の長さだけでなく、勤務時間帯も考慮して働き方データを分類することができる。 (8) By including attendance history data (section (D)) such as the employee's attendance and departure times for each individual in the work style data, it is possible to classify the work style data taking into account not only the length of work hours but also the working hours.
なお、上記ヘルスケアシステムは、以下のように適宜変更して実施することもできる。
・働き方データの中に従業員個人の出退勤履歴データを含めないようにしてもよい。
・予測フェーズにおける、予測部が選択した予測用機械学習モデルを変更する機能を省略してもよい。
The above-described healthcare system can be modified as follows.
- It is possible to avoid including employees' individual attendance history data in the work style data.
The function of changing the machine learning model for prediction selected by the prediction unit in the prediction phase may be omitted.
・学習フェーズにおいて、働き方データは、((G)項)の項目結合データを省略するようにしてもよい。
・健康にかかわる項目は、健康診断結果の項目、および、ストレスチェック結果の項目以外の項目を含んでいてもよい。また、健康にかかわる項目は、健康診断結果の項目、および、ストレスチェック結果の項目の何れか一方の項目だけでもよい。
In the learning phase, the work style data may omit the item combination data (item (G)).
The health-related items may include items other than the health check result items and the stress check result items. Also, the health-related items may be only either the health check result items or the stress check result items.
・予測する健康にかかわる項目の判定は、今回の健診やストレスチェックが実施された実施日から1年後に限定されるものではない。
・組織体としては、株式会社などの営利を目的とした組織体のほか、非営利の組織体であってもよい。
- The assessment of predicted health-related items will not be limited to one year after the date of the current health check or stress check.
The organization may be a for-profit organization such as a corporation, or a non-profit organization.
10…学習用データ入力部
11…健診データ入力部
12…ストレスチェックデータ入力部
13…勤怠データ入力部
14…人事データ入力部
15…給与データ入力部
16…生活習慣データ入力部
17…医療データ入力部
18…会社データ入力部
21…健診データ蓄積部
22…ストレスチェックデータ蓄積部
23…勤怠データ蓄積部
24…人事データ蓄積部
25…給与データ蓄積部
26…生活習慣データ蓄積部
28…会社データ蓄積部
31…働き方データ生成部
32…働き方データ分類部
33…分類データ生成部
34…教師データ生成部
35…学習部
36…予測対象者データ生成部
37…予測部
DESCRIPTION OF SYMBOLS 10...Learning data input section 11...Health check data input section 12...Stress check data input section 13...Attendance data input section 14...Personnel data input section 15...Salary data input section 16...Lifestyle data input section 17...Medical data input section 18...Company data input section 21...Health check data storage section 22...Stress check data storage section 23...Attendance data storage section 24...Personnel data storage section 25...Salary data storage section 26...Lifestyle data storage section 28...Company data storage section 31...Work style data generation section 32...Work style data classification section 33...Classification data generation section 34...Teacher data generation section 35...Learning section 36...Prediction target data generation section 37...Prediction section
Claims (6)
前記働き方データの各項目データを機械学習によって複数種類に分類する分類用機械学習モデルを生成する働き方データ分類部と、
前記構成員の健康診断およびストレスチェックが実施された実施日をもとに、今回と前回の2回分の健診判定データとストレスチェック判定データとを結合した健康関連結合データであって、前記健康関連結合データと前記構成員の健康診断およびストレスチェックにかかわる項目の前回の判定の実施日を起点として遡った期間の前記働き方データとを結合した初期結合データを生成し、前記初期結合データを前記働き方データ分類部が複数種類に分類し、その分類ごとに前記初期結合データを分割した分類データを生成する分類データ生成部と、
前記分類データごとに、今回の前記構成員の健診判定データおよびストレスチェック判定データにかかわる判定を目的変数とし、前記働き方データの各項目データ、および、前回の前記構成員の健診判定データおよびストレスチェック判定データにかかわる判定を説明変数に設定して教師データを生成する教師データ生成部と、
前記説明変数の判定ごとに、前記目的変数の予測用機械学習モデルを生成する学習部と、
予測対象者である構成員における健康診断およびストレスチェックにかかわる項目の今回の判定の実施日を起点として遡った期間の前記働き方データ、および、前記予測対象者である構成員の今回の健診判定データとストレスチェック判定データとを結合した予測対象者データを前記分類用機械学習モデルを用いて分類し、分類結果に応じた前記予測用機械学習モデルを用いて、前記予測対象者データを説明変数に設定して目的変数である将来の健康診断およびストレスチェックにかかわる項目の判定を予測する予測部とを備える
ヘルスケアシステム。 health checkup judgment aggregate data obtained by aggregating health checkup judgment data related to health checkup results of members of a plurality of organizations, stress check judgment aggregate data obtained by aggregating stress check judgment data related to stress check results of the members, attendance aggregate data obtained by aggregating attendance history related to attendance for each of the members, personnel history data related to personnel, and attendance history data related to attendance and lifestyle history data related to lifestyle for each member, each of which is item data, and a collection of the item data is work style data,
A work style data classification unit that generates a classification machine learning model that classifies each item data of the work style data into multiple types by machine learning;
a classification data generation unit which generates initial combined data by combining the health-related combined data and the working style data for a period going back from the implementation date of the previous assessment of items related to the health checkup and stress check of the member, the initial combined data being generated by combining the health-related combined data and the working style data for a period going back from the implementation date of the previous assessment of items related to the health checkup and stress check of the member, the working style data classification unit classifying the initial combined data into multiple types, and dividing the initial combined data for each classification;
a teacher data generating unit that generates teacher data for each of the classification data by setting a judgment related to the current health check judgment data and stress check judgment data of the member as an objective variable and each item data of the work style data and a judgment related to the previous health check judgment data and stress check judgment data of the member as explanatory variables;
A learning unit that generates a machine learning model for predicting the objective variable for each determination of the explanatory variable;
and a prediction unit that uses the classification machine learning model to classify the working style data for a period going back from the date of the current assessment of items related to health checkups and stress checks for the member who is the target of prediction, and prediction target data that combines the current health check assessment data and stress check assessment data of the member who is the target of prediction, and uses the predictive machine learning model in accordance with the classification result to set the prediction target data as an explanatory variable and predict the assessment of items related to future health checkups and stress checks, which is the objective variable.
前記分類データ生成部は、さらに、前記初期結合データにおける分類された項目データを結合した項目結合データを前記働き方データ分類部によって複数種類に分類する
請求項1に記載のヘルスケアシステム。 The work style data classification unit further classifies item combination data obtained by combining the classified item data in the work style data into a plurality of types by machine learning,
The healthcare system according to claim 1 , wherein the classified data generation unit further classifies, into a plurality of types, item combined data obtained by combining the classified item data in the initial combined data, by the work style data classification unit.
請求項1または2に記載のヘルスケアシステム。 The healthcare system according to claim 1 or 2, wherein the work style data classification unit generates feature points for each of the classifications.
前記予測部は、変更後の働き方データを含む前記予測対象者データを説明変数に設定して、選択された予測用機械学習モデルとは異なる前記予測用機械学習モデルを用いて、目的変数である将来の健診判定データおよびストレスチェック判定データにかかわる判定を予測する
請求項1ないし3のうち何れか1項に記載のヘルスケアシステム。 The work style data of the prediction subject is changeable,
The healthcare system according to any one of claims 1 to 3, wherein the prediction unit sets the prediction subject data including the changed working style data as an explanatory variable, and predicts a judgment related to future health check judgment data and stress check judgment data, which are objective variables, using a predictive machine learning model different from the selected predictive machine learning model.
請求項1ないし4のうち何れか1項に記載のヘルスケアシステム。 The healthcare system according to claim 1 , wherein the work style data includes work attendance history data for each of the members.
コンピュータを、
前記働き方データの各項目データを機械学習によって複数種類に分類する分類用機械学習モデルを生成する働き方データ分類部と、
前記構成員の健康診断およびストレスチェックが実施された実施日をもとに、今回と前回の2回分の健診判定データとストレスチェック判定データとを結合した健康関連結合データであって、前記健康関連結合データと前記構成員の健康診断およびストレスチェックにかかわる項目の前回の判定の実施日を起点として遡った期間の前記働き方データとを結合した初期結合データを生成し、前記初期結合データを前記働き方データ分類部が複数種類に分類し、その分類ごとに前記初期結合データを分割した分類データを生成する分類データ生成部と、
前記分類データごとに、今回の前記構成員の健診判定データおよびストレスチェック判定データにかかわる判定を目的変数とし、前記働き方データの各項目データ、および、前回の前記構成員の健診判定データおよびストレスチェック判定データにかかわる判定を説明変数に設定して教師データを生成する教師データ生成部と、
前記説明変数の判定ごとに、前記目的変数の予測用機械学習モデルを生成する学習部と、
予測対象者である構成員における健康診断およびストレスチェックにかかわる項目の今回の判定の実施日を起点として遡った期間の前記働き方データ、および、前記予測対象者である構成員の今回の健診判定データとストレスチェック判定データとを結合した予測対象者データを前記分類用機械学習モデルを用いて分類し、分類結果に応じた前記予測用機械学習モデルを用いて、前記予測対象者データを説明変数に設定して目的変数である将来の健康診断およびストレスチェックにかかわる項目の判定を予測する予測部
として機能させるヘルスケアプログラム。 health checkup judgment aggregate data obtained by aggregating health checkup judgment data related to health checkup results of members of a plurality of organizations, stress check judgment aggregate data obtained by aggregating stress check judgment data related to stress check results of the members, attendance aggregate data obtained by aggregating attendance history related to attendance for each of the members, personnel history data related to personnel, and attendance history data related to attendance and lifestyle history data related to lifestyle for each member, each of which is item data, and a collection of the item data is work style data,
Computer,
A work style data classification unit that generates a classification machine learning model that classifies each item data of the work style data into multiple types by machine learning;
a classification data generation unit which generates initial combined data by combining the health-related combined data and the working style data for a period going back from the implementation date of the previous assessment of items related to the health checkup and stress check of the member, the initial combined data being generated by combining the health-related combined data and the working style data for a period going back from the implementation date of the previous assessment of items related to the health checkup and stress check of the member, the working style data classification unit classifying the initial combined data into multiple types, and dividing the initial combined data for each classification;
a teacher data generating unit that generates teacher data for each of the classification data by setting a judgment related to the current health check judgment data and stress check judgment data of the member as an objective variable and each item data of the work style data and a judgment related to the previous health check judgment data and stress check judgment data of the member as explanatory variables;
A learning unit that generates a machine learning model for predicting the objective variable for each determination of the explanatory variable;
A healthcare program that functions as a prediction unit that classifies, using the classification machine learning model, the work style data for the period going back from the date of the current assessment of items related to health checkups and stress checks for the member who is the target of prediction, and prediction target data that combines the current health check assessment data and stress check assessment data of the member who is the target of prediction, and uses the predictive machine learning model in accordance with the classification results to set the prediction target data as an explanatory variable and predict the assessment of items related to future health checkups and stress checks, which are the objective variables.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2020191230A JP7534749B2 (en) | 2020-11-17 | 2020-11-17 | Healthcare Systems and Programs |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2020191230A JP7534749B2 (en) | 2020-11-17 | 2020-11-17 | Healthcare Systems and Programs |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2022080198A JP2022080198A (en) | 2022-05-27 |
| JP7534749B2 true JP7534749B2 (en) | 2024-08-15 |
Family
ID=81731670
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2020191230A Active JP7534749B2 (en) | 2020-11-17 | 2020-11-17 | Healthcare Systems and Programs |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP7534749B2 (en) |
Families Citing this family (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2024024413A (en) * | 2022-08-09 | 2024-02-22 | 株式会社ラフール | Information processing methods, programs, information processing systems |
| JPWO2024210083A1 (en) * | 2023-04-06 | 2024-10-10 | ||
| JP2025014921A (en) * | 2023-07-19 | 2025-01-30 | 株式会社島津製作所 | Method for assisting diagnosis of mental stress |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2017010103A1 (en) | 2015-07-16 | 2017-01-19 | 日本電気株式会社 | Data analysis device, data analysis method, and storage medium storing data analysis program |
| WO2019187933A1 (en) | 2018-03-26 | 2019-10-03 | Necソリューションイノベータ株式会社 | Health assistance system, information providing sheet output device, method, and program |
| JP2020052757A (en) | 2018-09-27 | 2020-04-02 | 株式会社メディリード | Information processing apparatus, information processing method and program |
-
2020
- 2020-11-17 JP JP2020191230A patent/JP7534749B2/en active Active
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2017010103A1 (en) | 2015-07-16 | 2017-01-19 | 日本電気株式会社 | Data analysis device, data analysis method, and storage medium storing data analysis program |
| WO2019187933A1 (en) | 2018-03-26 | 2019-10-03 | Necソリューションイノベータ株式会社 | Health assistance system, information providing sheet output device, method, and program |
| JP2020052757A (en) | 2018-09-27 | 2020-04-02 | 株式会社メディリード | Information processing apparatus, information processing method and program |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2022080198A (en) | 2022-05-27 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Brot-Goldberg et al. | Rationing medicine through bureaucracy: authorization restrictions in Medicare | |
| Abaluck et al. | Choice inconsistencies among the elderly: evidence from plan choice in the Medicare Part D program | |
| US8165894B2 (en) | Fully automated health plan administrator | |
| Dudley et al. | The impact of financial incentives on quality of health care | |
| US20190080501A1 (en) | Method, apparatus and system for financial planning incorporating calculated health costs based on actual claims and the actual cost thereof | |
| JP4237541B2 (en) | Insurer information system | |
| US20160203279A1 (en) | System and Method for Evidence Based Differential Analysis and Incentives Based Healthcare Policy | |
| US20080059242A1 (en) | Health information management system and method | |
| US20060229932A1 (en) | Intelligent sales and marketing recommendation system | |
| Bundorf | Consumer‐directed health plans: a review of the evidence | |
| Goetzel et al. | Ten modifiable health risk factors and employees’ medical costs—an update | |
| Derose et al. | Measuring quality of care and performance from a population health care perspective | |
| JP7534749B2 (en) | Healthcare Systems and Programs | |
| US20160378942A1 (en) | System and method to estimate reduction of lifetime healthcare costs based on body mass index | |
| Diamond et al. | Take-up, drop-out, and spending in ACA marketplaces | |
| US20080126130A1 (en) | Compliance With A Medication Therapy Regimen | |
| Morrison et al. | Impacts of Maryland’s global budgets on Medicare and commercial spending and utilization | |
| Pani et al. | Effects of various financial and non-financial incentives on the performance of accredited social health activist: evidence from two selected districts of Odisha | |
| Atanasov et al. | Putting health back into health insurance choice | |
| JP7375801B2 (en) | Information processing system and information processing method | |
| Bharadwaj et al. | Preliminary analysis of an advanced health care practitioner-led home-visit primary care program for high-risk patients reduced health care costs and utilization | |
| Melody et al. | Implementation of a student pharmacist-run targeted medication intervention program | |
| Mimi | The routine health information system in Palestine: determinants and performance | |
| Hu et al. | Intelligent selection of frequent emergency department patients for case management: A machine learning framework based on claims data | |
| JP7777206B1 (en) | Information processing device, information processing method, and program for supporting measures against polypharmacy |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230824 |
|
| TRDD | Decision of grant or rejection written | ||
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240708 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240709 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240725 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7534749 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |