Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP7704045B2 - Document correction support program, document correction support method, and information processing device - Google Patents
[go: Go Back, main page]

JP7704045B2 - Document correction support program, document correction support method, and information processing device - Google Patents

Document correction support program, document correction support method, and information processing device Download PDF

Info

Publication number
JP7704045B2
JP7704045B2 JP2022023005A JP2022023005A JP7704045B2 JP 7704045 B2 JP7704045 B2 JP 7704045B2 JP 2022023005 A JP2022023005 A JP 2022023005A JP 2022023005 A JP2022023005 A JP 2022023005A JP 7704045 B2 JP7704045 B2 JP 7704045B2
Authority
JP
Japan
Prior art keywords
document
value
specific
documents
cases
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022023005A
Other languages
Japanese (ja)
Other versions
JP2023119888A (en
Inventor
一穂 前田
進 遠藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2022023005A priority Critical patent/JP7704045B2/en
Publication of JP2023119888A publication Critical patent/JP2023119888A/en
Application granted granted Critical
Publication of JP7704045B2 publication Critical patent/JP7704045B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)

Description

本発明の実施形態は、文書修正支援プログラム、文書修正支援方法および情報処理装置に関する。 Embodiments of the present invention relate to a document correction assistance program, a document correction assistance method, and an information processing device.

従来、窓口等で提出された種々の書類(以下、資料ともよぶ)については、書類間の整合性をチェックし、不整合のある項目を職員が修正している。例えば、税業務の窓口では、毎年、多くの申告書類が提出されている。提出された書類は、職員が、住民の基本情報や雇用元の提出書類と突き合わせて、間違いが無いかをチェックしている。 Conventionally, various documents (hereafter referred to as documents) submitted at counters etc. are checked for consistency between documents, and employees correct any inconsistencies. For example, many tax return forms are submitted at tax counters every year. Employees check the submitted documents for errors by comparing them with basic information about residents and documents submitted by their employers.

図8は、書類不備の修正の一例を説明する説明図である。図8に示すように、住民H1は、確定申告書D1および住民税申告書D2を市役所に提出する。また、住民H1の勤務先K1、K2は、住民H1に関する給与支払報告書D3、D4を提出する。また、年金機構K3は、住民H1に関する年金支払報告書D5を提出する。市役所の職員H2は、提出された確定申告書D1、住民税申告書D2、給与支払報告書D3、D4および年金支払報告書D5の各項目の記載を比較する。そして、職員H2は、不整合のある項目を検出し、その項目のデータを修正する。 Figure 8 is an explanatory diagram that explains an example of correcting document deficiencies. As shown in Figure 8, resident H1 submits a final tax return D1 and a resident tax return D2 to city hall. In addition, resident H1's employers K1 and K2 submit salary payment reports D3 and D4 related to resident H1. In addition, the pension service K3 submits a pension payment report D5 related to resident H1. City hall employee H2 compares the details of each item in the submitted final tax return D1, resident tax return D2, salary payment reports D3 and D4, and pension payment report D5. Employee H2 then detects any items that are inconsistent and corrects the data for those items.

このような、文書修正作業のサポートについては、各療養機関サーバから受信される請求書と明細書に対する記載内容を、既存のルールに従い点検する従来技術がある。また、文書の各項目内容の意味ベクトルが予め登録された規範文書における該当項目の意味ベクトルの重心からずれているかで、項目内容の妥当性を判定する従来技術がある。また、修正済みの資料データを機械学習して得られた学習済みモデルに対して評価対象の資料データを入力して得られた評価結果を表示する従来技術がある。また、新たな文書集合を学習データとして用いることでモデルを更新する従来技術がある。 To support such document correction work, there is a conventional technique that checks the contents of invoices and detailed statements received from each medical institution server according to existing rules. There is also a conventional technique that judges the validity of the item contents based on whether the semantic vector of each item content of a document deviates from the center of gravity of the semantic vector of the corresponding item in a pre-registered normative document. There is also a conventional technique that displays the evaluation results obtained by inputting the document data to be evaluated into a trained model obtained by machine learning the corrected document data. There is also a conventional technique that updates the model by using a new set of documents as training data.

特開2007-241986号公報JP 2007-241986 A 特開2020-140442号公報JP 2020-140442 A 特開2018-147280号公報JP 2018-147280 A 特開2021-89473号公報JP 2021-89473 A

給与支払報告書D3、D4のように、提出された文書の中に同種の文書が複数含まれる場合がある。このような場合、市役所の職員H2は、文書間の関係性を考慮した上で、同種の文書の中からいずれの文書を修正するのかを決めている。 There are cases where the submitted documents contain multiple documents of the same type, such as salary payment reports D3 and D4. In such cases, city hall employee H2 considers the relationships between the documents and decides which of the documents of the same type to revise.

しかしながら、上記の従来技術では、提出された複数の文書間の関係性が考慮されておらず、不整合のある項目を特定できたとしても、どの文書を修正するかを特定することは困難であった。 However, the above-mentioned conventional technology does not take into account the relationships between the multiple documents submitted, and even if it is possible to identify inconsistent items, it is difficult to identify which documents need to be revised.

1つの側面では、修正対象の文書を容易に特定できる文書修正支援プログラム、文書修正支援方法および情報処理装置を提供することを目的とする。 In one aspect, the objective is to provide a document correction assistance program, a document correction assistance method, and an information processing device that can easily identify documents to be corrected.

1つの案では、文書修正支援プログラムは、入力する処理と、出力する処理とをコンピュータに実行させる。入力する処理は、各文書の修正履歴を含む複数の事例の学習用データをもとに、事例ごとに、予め定義された復元演算に基づいて特定の第1の文書に含まれる項目の値および特定の第2の文書に含まれる項目の値より演算した値と、第1の文書に含まれる項目の値との差分を含む説明変数と、事例の各文書における修正履歴に対応する値を含む目的変数とに基づいて機械学習したモデルに対して、判定対象の各文書に基づいて生成した説明変数を入力する。出力する処理は、モデルからの出力に基づいて、判定対象の各文書における修正の有無を出力する。 In one proposal, the document correction assistance program causes a computer to execute an input process and an output process. The input process is based on learning data of a plurality of cases including the correction history of each document, and inputs explanatory variables generated based on each document to a machine-learned model based on explanatory variables including the difference between a value calculated from the value of an item included in a specific first document and the value of an item included in a specific second document based on a predefined restoration calculation for each case, and the value of the item included in the first document, and a target variable including a value corresponding to the correction history of each document of the cases. The output process is based on the output from the model and outputs whether or not each document to be determined is corrected.

修正対象の文書を容易に特定できる。 Documents to be corrected can be easily identified.

図1は、実施形態にかかる情報処理装置の機能構成例を示すブロック図である。FIG. 1 is a block diagram illustrating an example of a functional configuration of an information processing apparatus according to an embodiment. 図2は、復元演算定義情報の一例を説明する説明図である。FIG. 2 is an explanatory diagram illustrating an example of the restoration computation definition information. 図3は、実施形態にかかる情報処理装置の動作例を示すフローチャートである。FIG. 3 is a flowchart illustrating an example of the operation of the information processing device according to the embodiment. 図4は、実施形態にかかる情報処理装置の学習処理の一例を示すフローチャートである。FIG. 4 is a flowchart illustrating an example of a learning process of the information processing device according to the embodiment. 図5は、学習用データの一例を説明する説明図である。FIG. 5 is an explanatory diagram illustrating an example of learning data. 図6は、実施形態にかかる情報処理装置の判定処理の一例を示すフローチャートである。FIG. 6 is a flowchart illustrating an example of a determination process of the information processing device according to the embodiment. 図7は、コンピュータ構成の一例を示すブロック図である。FIG. 7 is a block diagram showing an example of a computer configuration. 図8は、書類不備の修正の一例を説明する説明図である。FIG. 8 is an explanatory diagram for explaining an example of correcting a document defect.

以下、図面を参照して、実施形態にかかる文書修正支援プログラム、文書修正支援方法および情報処理装置を説明する。実施形態において同一の機能を有する構成には同一の符号を付し、重複する説明は省略する。なお、以下の実施形態で説明する文書修正支援プログラム、文書修正支援方法および情報処理装置は、一例を示すに過ぎず、実施形態を限定するものではない。また、以下の各実施形態は、矛盾しない範囲内で適宜組みあわせてもよい。 The document correction support program, document correction support method, and information processing device according to the embodiments will be described below with reference to the drawings. Configurations having the same functions in the embodiments will be given the same reference numerals, and duplicated descriptions will be omitted. Note that the document correction support program, document correction support method, and information processing device described in the following embodiments are merely examples, and do not limit the embodiments. In addition, the following embodiments may be combined as appropriate within a range that does not cause contradictions.

図1は、実施形態にかかる情報処理装置の機能構成例を示すブロック図である。図1に示すように、情報処理装置1は、入力部10、目的変数生成部20、説明変数生成部30、記憶部40、学習部50および判定部60を有する。 FIG. 1 is a block diagram showing an example of the functional configuration of an information processing device according to an embodiment. As shown in FIG. 1, the information processing device 1 has an input unit 10, a target variable generation unit 20, an explanatory variable generation unit 30, a storage unit 40, a learning unit 50, and a determination unit 60.

情報処理装置1は、修正済資料データ11を学習用データとして機械学習することで学習モデル71を生成する学習装置の一例である。また、情報処理装置1は、判定対象の未修正資料データ12に含まれる各文書について、生成した学習モデル71を用いて修正の有無を判定して出力する判定装置の一例である。 The information processing device 1 is an example of a learning device that generates a learning model 71 by machine learning the corrected material data 11 as learning data. The information processing device 1 is also an example of a determination device that determines whether or not each document included in the uncorrected material data 12 to be determined has been corrected using the generated learning model 71 and outputs the result.

なお、上記の学習装置および判定装置は一つの情報処理装置1で実現してもよいが、分割して実現してもよい。例えば、情報処理装置1は、入力部10、目的変数生成部20、説明変数生成部30、記憶部40および学習部50を有する学習装置であってもよい。また、情報処理装置1は、入力部10、目的変数生成部20、説明変数生成部30、記憶部40および判定部60を有する判定装置であってもよい。 The above-mentioned learning device and judgment device may be realized by a single information processing device 1, or may be realized separately. For example, the information processing device 1 may be a learning device having an input unit 10, a target variable generation unit 20, an explanatory variable generation unit 30, a memory unit 40, and a learning unit 50. The information processing device 1 may also be a judgment device having an input unit 10, a target variable generation unit 20, an explanatory variable generation unit 30, a memory unit 40, and a judgment unit 60.

入力部10は、修正済資料データ11、未修正資料データ12等の各種データの入力を受け付ける処理部である。 The input unit 10 is a processing unit that accepts input of various data such as corrected material data 11 and uncorrected material data 12.

修正済資料データ11は、各事例における各書類の修正済み内容を記述したデータである。例えば、修正済資料データ11は、各事例において、各書類(資料)の内容(例えば各項目における記入値)と、各書類における修正の有無(例えば不備のある項目と、その項目における修正値)とを含むデータである。一例として、修正済資料データ11には、税業務において住民H1が提出し、職員H2が修正した各書類の項目の値と、修正の有無とが含まれる。 Corrected document data 11 is data that describes the corrected content of each document in each case. For example, corrected document data 11 is data that includes the content of each document (document) in each case (e.g., the value entered in each item) and whether or not each document has been corrected (e.g., an item with an error and the corrected value for that item). As an example, corrected document data 11 includes the values of the items of each document submitted by resident H1 and corrected by employee H2 in tax procedures, and whether or not it has been corrected.

機械学習では、修正済資料データ11をもとに、事例ごとに、各書類の内容に対応する特徴量を説明変数とし、修正の有無に対応する値を目的変数として生成する。ついで、機械学習では、ニューラルネットワーク等のモデルの入力層に生成した説明変数を入力した場合、そのモデルの出力層から目的変数が得られるように、モデルのパラメータを求める。 In machine learning, based on the corrected document data 11, for each case, feature quantities corresponding to the contents of each document are used as explanatory variables, and a value corresponding to the presence or absence of corrections is generated as a target variable. Next, in machine learning, when the generated explanatory variables are input into the input layer of a model such as a neural network, the model parameters are calculated so that the target variable can be obtained from the output layer of the model.

未修正資料データ12は、判定対象の事例に関する各書類の内容を記述したデータである。例えば、未修正資料データ12は、判定対象の事例における各書類(資料)の内容(例えば各項目における記入値)を含むデータである。一例として、未修正資料データ12には、税業務において住民H1が提出した各書類の項目の値が含まれる。 Uncorrected document data 12 is data that describes the contents of each document related to the case being assessed. For example, uncorrected document data 12 is data that includes the contents of each document (document) in the case being assessed (e.g., the values entered in each item). As an example, uncorrected document data 12 includes the values of the items in each document submitted by resident H1 for tax purposes.

目的変数生成部20は、修正済資料データ11をもとに目的変数を生成する処理部である。具体的には、目的変数生成部20は、機械学習時において修正済資料データ11に含まれる事例ごとに、事例の各書類における修正の有無を数値化した目的変数を生成する。 The objective variable generation unit 20 is a processing unit that generates an objective variable based on the corrected material data 11. Specifically, the objective variable generation unit 20 generates an objective variable that quantifies the presence or absence of corrections in each document of the case for each case included in the corrected material data 11 during machine learning.

説明変数生成部30は、修正済資料データ11または未修正資料データ12をもとに説明変数を生成する処理部である。具体的には、説明変数生成部30は、修正済資料データ11または未修正資料データ12の各事例において、各書類(資料)の内容(例えば各項目における記入値)を数値化した説明変数を生成する。 The explanatory variable generation unit 30 is a processing unit that generates explanatory variables based on the corrected document data 11 or the uncorrected document data 12. Specifically, the explanatory variable generation unit 30 generates explanatory variables that quantify the contents of each document (document) (e.g., the entered values in each item) for each case of the corrected document data 11 or the uncorrected document data 12.

情報処理装置1は、機械学習時において、修正済資料データ11の事例ごとに、各書類について目的変数生成部20が生成した目的変数と、説明変数生成部30が生成した説明変数とを、例えば各書類を行とする配列として組み合わせたデータを機械学習用の学習用データ70とする。また、情報処理装置1は、学習モデル71を用いた判定時において、未修正資料データ12をもとに各書類について説明変数生成部30が生成した説明変数を、例えば各書類を行とする配列としたデータを評価用データ80とする。 During machine learning, the information processing device 1 combines the objective variables generated by the objective variable generation unit 20 for each document and the explanatory variables generated by the explanatory variable generation unit 30 for each case of the corrected material data 11, for example, in an array with each document as a row, to obtain learning data 70 for machine learning. Furthermore, during judgment using the learning model 71, the information processing device 1 obtains evaluation data 80 by combining the explanatory variables generated by the explanatory variable generation unit 30 for each document based on the uncorrected material data 12, for example, in an array with each document as a row.

この説明変数生成部30が生成する説明変数には、予め定義された復元演算に基づいて、特定の文書と、その文書とは別にある特定の文書(他の文書とよぶ)の項目の値より演算した値と、特定の文書の項目の値との差分、すなわち特定の文書と他の文書との間の関係性に対応する値が含まれる。 The explanatory variables generated by the explanatory variable generation unit 30 include a difference between a value calculated from the values of items in a specific document and a specific document (called the other document) other than the specific document based on a predefined restoration calculation, and the value of the item in the specific document, i.e., a value corresponding to the relationship between the specific document and the other document.

ここで、特定の文書および他の文書は、復元演算の定義内容において予め指定されたものであり、例えば定義内容で文書の種別を指定することで、同一の種別の文書が指定される。例えば、復元演算の定義内容において給与支払報告書を指定することで、各事例において提出された複数の給与支払報告書(例えば給与支払報告書D3、D4)が特定の文書および他の文書とされることとなる。 Here, the specific document and other documents are specified in advance in the definition content of the reconstruction operation. For example, by specifying a document type in the definition content, documents of the same type are specified. For example, by specifying a payroll payment report in the definition content of the reconstruction operation, multiple payroll payment reports submitted in each case (e.g., payroll payment reports D3 and D4) become the specific document and other documents.

また、復元演算は、特定の文書および他の文書間において定型的な「資料の分かれ方」を定義し、それを復元する演算である。一例として、復元演算は、資料種別ごとに、住民H1より提出された複数の文書(例えば給与支払報告書D3、D4)の項目における正しい値を職員H2が推定する際に頭の中で行う演算である。すなわち、復元演算の結果は、資料種別ごとの正しい値の候補となる。また、復元演算の結果は、該当資料種別の資料全体(例えば給与支払報告書D3、D4)の特徴を表す。したがって、その演算結果と、特定の資料の項目との差分は、特定の資料と、他の資料との関係性を間接的に表現している。 The reconstruction calculation is a calculation that defines a typical "way of dividing documents" between a specific document and other documents and restores it. As an example, the reconstruction calculation is a calculation that employee H2 performs in his head when estimating the correct values for the items of multiple documents (e.g., salary payment reports D3, D4) submitted by resident H1 for each document type. In other words, the results of the reconstruction calculation are candidates for the correct values for each document type. The results of the reconstruction calculation represent the characteristics of the entire document of that document type (e.g., salary payment reports D3, D4). Therefore, the difference between the calculation result and the items of a specific document indirectly represents the relationship between the specific document and other documents.

上記の説明変数を生成する構成として、説明変数生成部30は、復元演算計算部31と、差分計算部32とを有する。 To generate the explanatory variables, the explanatory variable generation unit 30 has a reconstruction calculation unit 31 and a difference calculation unit 32.

復元演算計算部31は、記憶部40に記憶された復元演算定義情報41に基づいて、修正済資料データ11または未修正資料データ12の各事例に含まれる特定の文書と、その文書とは別にある他の文書の項目の値より復元演算を行う処理部である。 The restoration calculation unit 31 is a processing unit that performs restoration calculations based on the restoration calculation definition information 41 stored in the memory unit 40, using the values of items of a specific document included in each case of the modified material data 11 or the unmodified material data 12 and other documents separate from that document.

差分計算部32は、復元演算定義情報41に基づいて、復元演算計算部31による復元演算の結果と、特定の文書の項目の値との差分を求める処理部である。 The difference calculation unit 32 is a processing unit that calculates the difference between the result of the restoration calculation performed by the restoration calculation calculation unit 31 and the value of an item of a specific document based on the restoration calculation definition information 41.

図2は、復元演算定義情報41の一例を説明する説明図である。図2に示すように、復元演算定義情報41には、特定の文書と他の文書間において定型的な「資料の分かれ方」を定義し、それを復元する「復元演算」が示されている。なお、復元演算定義情報41については、確定申告書、D2、D3等の文書の種別ごとに用意されており、文書の種別ごとに、文書間における項目ごとの復元演算の内容が定義されている。なお、以下の例では、復元演算が対象とする資料の値を0と正に限定して説明するが、復元演算が対象とする対象とする資料の値をこれらに限定するものではない。 Figure 2 is an explanatory diagram explaining an example of restoration calculation definition information 41. As shown in Figure 2, the restoration calculation definition information 41 defines a typical "way of separating documents" between a specific document and other documents, and shows a "restoration calculation" that restores it. Note that the restoration calculation definition information 41 is prepared for each type of document, such as tax returns, D2, D3, etc., and the contents of the restoration calculation for each item between documents are defined for each document type. Note that in the following example, the values of documents targeted by the restoration calculation are limited to 0 and positive, but the values of documents targeted by the restoration calculation are not limited to these.

例えば、復元演算定義情報41に定義された「復元演算」における「資料の分かれ方」としては、ある資料(例えば給与支払報告書D3)の値が、他の資料(例えば給与支払報告書D4)の値に包括されているケースがある。このようなケースの「復元演算」では、2つの資料の値の最大値を求める。したがって、このケースの復元演算の結果と、ある資料の値との差分の意味は、0ならばこの資料が最大値であり、0以外ならば他の資料のどれかが最大値であることとなる。 For example, the "way of dividing data" in the "reconstruction calculation" defined in the reconstruction calculation definition information 41 may be a case where the value of one data (e.g., salary payment report D3) is included in the value of another data (e.g., salary payment report D4). In the "reconstruction calculation" in such a case, the maximum value of the values of the two data is found. Therefore, the meaning of the difference between the result of the reconstruction calculation in this case and the value of a data is that if it is 0, then this data is the maximum value, and if it is non-zero, then one of the other data is the maximum value.

また、復元演算定義情報41に定義された「復元演算」における「資料の分かれ方」としては、別々の資料に値が計上されており、資料間で値が重複していないケースがある。このようなケースの「復元演算」では、全ての資料の値の合計を求める。したがって、このケースの復元演算の結果と、ある資料の値との差分の意味は、0ならばこの資料のみに正の値があり、0以外ならば他の資料にも正の値があることとなる。 In addition, the "way of dividing materials" in the "restoration calculation" defined in the restoration calculation definition information 41 may mean that values are recorded in separate materials, with no overlap between the materials. In the "restoration calculation" in such a case, the sum of the values of all materials is calculated. Therefore, the meaning of the difference between the result of the restoration calculation in this case and the value of a certain material is that if it is 0, only this material has a positive value, and if it is non-zero, the other materials also have positive values.

また、復元演算定義情報41に定義された「復元演算」における「資料の分かれ方」としては、特定の資料の項目に別の項目の値を誤記載するケースがある。このようなケースの「復元演算」では、全ての資料の値の合計から該当資料の値を減算する。したがって、このケースの復元演算の結果と、ある資料の値との差分の意味は、0ならばこの資料と該当資料のみに正の値があり、0以外ならば他の資料にも正の値があるか、この資料が該当資料か値が0かのいずれかとなる。 In addition, the "way of dividing materials" in the "restoration calculation" defined in the restoration calculation definition information 41 can be a case where the value of a specific material item is mistakenly entered in the item of another material. In the "restoration calculation" in such a case, the value of the relevant material is subtracted from the sum of the values of all materials. Therefore, the meaning of the difference between the result of the restoration calculation in this case and the value of a certain material is that if it is 0, then only this material and the relevant material have positive values, and if it is non-zero, then either the other material also has a positive value, or this material is the relevant material or its value is 0.

記憶部40は、メモリやHDD(Hard Disk Drive)等の記憶装置であり、復元演算定義情報41を格納する。 The storage unit 40 is a storage device such as a memory or a hard disk drive (HDD), and stores the restoration calculation definition information 41.

学習部50は、学習用データ70の各事例について、説明変数生成部30が生成した説明変数と、目的変数生成部20が生成した目的変数とをもとに、公知の機械学習処理を行うことで学習モデル71を生成する処理部である。学習部50が行う機械学習処理としては、決定木、ランダムフォレスト、ディープラーニング等がある。例えば、ディープラーニングの場合、学習部50は、説明変数を入力した場合に、目的変数に対応する出力を行うように隠れ層のパラメータを求めることで、学習モデル71を生成する。 The learning unit 50 is a processing unit that generates a learning model 71 by performing known machine learning processing for each example of the learning data 70 based on the explanatory variables generated by the explanatory variable generation unit 30 and the objective variables generated by the objective variable generation unit 20. The machine learning processing performed by the learning unit 50 includes decision trees, random forests, deep learning, and the like. For example, in the case of deep learning, the learning unit 50 generates the learning model 71 by determining hidden layer parameters so that, when an explanatory variable is input, an output corresponding to the objective variable is produced.

判定部60は、判定対象の事例に関して未修正資料データ12をもとに生成した説明変数を含む評価用データ80を学習モデル71に入力して、判定対象の事例の判別結果を取得する処理部である。具体的には、判定部60は、学習部50の機械学習により得られたパラメータを読み出して学習モデル71を構築する。次いで、判定部60は、学習モデル71に対して未修正資料データ12をもとに生成した説明変数、すなわち判定対象の各書類の特徴量を入力する。次いで、判定部60は、学習モデル71の出力より、判定対象の各書類における修正の有無を示す確度(評価値)を得る。判定部60は、得られた確度をもとに、例えば所定の閾値と比較することで、各書類における修正の有無を示す判定結果81を出力する。 The judgment unit 60 is a processing unit that inputs evaluation data 80 including explanatory variables generated based on the uncorrected material data 12 for the case to be judged to the learning model 71 and obtains a judgment result for the case to be judged. Specifically, the judgment unit 60 reads out parameters obtained by machine learning in the learning unit 50 to construct the learning model 71. Next, the judgment unit 60 inputs the explanatory variables generated based on the uncorrected material data 12, i.e., the feature quantities of each document to be judged, to the learning model 71. Next, the judgment unit 60 obtains a degree of accuracy (evaluation value) indicating the presence or absence of corrections in each document to be judged from the output of the learning model 71. The judgment unit 60 outputs a judgment result 81 indicating the presence or absence of corrections in each document based on the obtained degree of accuracy, for example, by comparing it with a predetermined threshold value.

図3は、実施形態にかかる情報処理装置の動作例を示すフローチャートである。図3に示すように、情報処理装置1では、修正済資料データ11を学習用データとし、復元演算定義情報41に基づく復元計算の結果を説明変数に含めた学習処理を行い(S1)、学習モデル71を生成する。 Fig. 3 is a flowchart showing an example of the operation of the information processing device according to the embodiment. As shown in Fig. 3, the information processing device 1 performs a learning process (S1) using the corrected material data 11 as learning data and including the results of the restoration calculation based on the restoration calculation definition information 41 as explanatory variables, thereby generating a learning model 71.

図4は、実施形態にかかる情報処理装置1の学習処理の一例を示すフローチャートである。図4に示すように、学習処理が開始されると、復元演算計算部31は、修正済資料データ11に含まれる事例(住民)ごとに、提出された各書類(資料)の値を取得する。ついで、復元演算計算部31は、復元演算定義情報41の定義内容に基づいて、特定の文書と、その文書とは別にある他の文書の項目の値より復元演算を行う(S10)。 Figure 4 is a flowchart showing an example of the learning process of the information processing device 1 according to the embodiment. As shown in Figure 4, when the learning process is started, the restoration calculation unit 31 obtains the values of each submitted document (document) for each case (resident) included in the corrected document data 11. Next, the restoration calculation unit 31 performs a restoration calculation from the values of items of a specific document and another document separate from that document, based on the definition contents of the restoration calculation definition information 41 (S10).

ついで、差分計算部32は、復元演算計算部31による復元演算結果と、資料の値との差分を計算し(S11)、この計算結果を説明変数として学習用データ70に格納する(S12)。 Then, the difference calculation unit 32 calculates the difference between the reconstruction calculation result by the reconstruction calculation unit 31 and the value of the material (S11), and stores this calculation result in the learning data 70 as an explanatory variable (S12).

ついで、説明変数生成部30は、事例に含まれる全ての資料について説明変数を生成する処理を終了したか否かを判定する(S13)。事例に含まれる全ての資料について処理を終了していない場合(S13:No)、説明変数生成部30は、S10へ処理を戻す。 Next, the explanatory variable generation unit 30 determines whether the process of generating explanatory variables for all materials included in the case has been completed (S13). If the process has not been completed for all materials included in the case (S13: No), the explanatory variable generation unit 30 returns the process to S10.

事例に含まれる全ての資料について処理を終了した場合(S13:Yes)、説明変数生成部30は、復元演算定義情報41に定義された全ての復元演算を処理したか否かを判定する(S14)。全ての復元演算を処理していない場合(S14:No)、説明変数生成部30は、S10へ処理を戻す。 When processing has been completed for all materials included in the case (S13: Yes), the explanatory variable generation unit 30 determines whether or not all the reconstruction operations defined in the reconstruction operation definition information 41 have been processed (S14). When not all the reconstruction operations have been processed (S14: No), the explanatory variable generation unit 30 returns the process to S10.

全ての復元演算を処理した場合(S14:Yes)、説明変数生成部30は、資料の全ての項目について説明変数の生成に関する処理を行ったか否かを判定する(S15)。全ての項目について処理をしていない場合(S15:No)、説明変数生成部30は、S10へ処理を戻す。 If all the reconstruction calculations have been processed (S14: Yes), the explanatory variable generation unit 30 determines whether the process for generating explanatory variables has been performed for all items of the document (S15). If the process has not been performed for all items (S15: No), the explanatory variable generation unit 30 returns to S10.

全ての項目を処理した場合(S15:Yes)、説明変数生成部30は、全ての住民(事例)を処理したか否かを判定する(S16)。全ての住民について処理をしていない場合(S16:No)、説明変数生成部30は、S10へ処理を戻す。 If all items have been processed (S15: Yes), the explanatory variable generation unit 30 determines whether all residents (cases) have been processed (S16). If not all residents have been processed (S16: No), the explanatory variable generation unit 30 returns to S10.

全ての住民を処理した場合(S16:Yes)、目的変数生成部20は、修正済資料データ11に含まれる事例(住民)ごとに、提出された各書類(資料)の修正の有無を算出する(S17)。ついで、目的変数生成部20は、各資料の修正の有無についての算出結果を目的変数として学習用データ70に格納する(S18)。 When all residents have been processed (S16: Yes), the objective variable generation unit 20 calculates whether each submitted document (document) has been corrected for each case (resident) included in the corrected document data 11 (S17). Next, the objective variable generation unit 20 stores the calculation result regarding whether each document has been corrected in the learning data 70 as an objective variable (S18).

ついで、目的変数生成部20は、全ての資料について目的変数の生成に関する処理を行ったか否かを判定する(S19)。全ての資料について処理をしていない場合(S19:No)、目的変数生成部20は、S17へ処理を戻す。 Next, the objective variable generation unit 20 determines whether or not the process for generating objective variables has been performed for all materials (S19). If the process has not been performed for all materials (S19: No), the objective variable generation unit 20 returns the process to S17.

全ての資料について処理を行った場合(S19:Yes)、学習部50は、学習用データ70をもとに機械学習を行って学習モデル71を生成し(S20)、処理を終了する。 If all materials have been processed (S19: Yes), the learning unit 50 performs machine learning based on the learning data 70 to generate a learning model 71 (S20) and ends the process.

図5は、学習用データ70の一例を説明する説明図である。図5に示すように、機械学習を行う際には、修正済資料データ11に含まれる事例(住民A、住民B)ごとに、修正済みの資料(1)、(2)、(3)…をもとに、各資料の内容に対応する特徴量を説明変数とし、修正の有無に対応する値を目的変数とする学習用データ70を生成する。 Figure 5 is an explanatory diagram illustrating an example of learning data 70. As shown in Figure 5, when performing machine learning, for each case (resident A, resident B) included in the corrected material data 11, learning data 70 is generated based on the corrected materials (1), (2), (3), etc., with the feature quantities corresponding to the content of each material as explanatory variables and the value corresponding to the presence or absence of correction as the objective variable.

ここで、学習用データ70における説明変数には、復元演算定義情報41で定義された復元演算に基づいて、特定の文書と、その文書とは別にある他の文書の項目の値より演算した値と、特定の文書の項目の値との差分、すなわち特定の文書と他の文書間の関係性に対応する値が含まれる。 Here, the explanatory variables in the learning data 70 include the difference between the value calculated from the values of items in a specific document and another document separate from that document, based on the restoration calculation defined in the restoration calculation definition information 41, and the value of the item in the specific document, i.e., the value corresponding to the relationship between the specific document and the other document.

例えば、住民Aの資料(1)に関する説明変数には、資料(1)の項目について、復元演算a、b、c…により得られた値との差分、すなわち、資料(1)と他の文書(例えば資料(2)、資料(3)…)間の関係性に対応する値が含まれる。同様に、資料(2)に関する説明変数には、資料(2)の項目について、復元演算a、b、c…により得られた値との差分、すなわち、資料(2)と他の文書(例えば資料(1)、資料(3)…)間の関係性に対応する値が含まれる。また、資料(3)に関する説明変数には、資料(3)の項目について、復元演算a、b、c…により得られた値との差分、すなわち、資料(3)と他の文書(例えば資料(1)、資料(2)…)間の関係性に対応する値が含まれる。なお、各事例(住民B…)についても同様である。 For example, the explanatory variables for resident A's document (1) include values that correspond to the difference between the values obtained by the reconstruction calculations a, b, c, etc. for the items in document (1), i.e., values corresponding to the relationship between document (1) and other documents (e.g., document (2), document (3), etc.). Similarly, the explanatory variables for document (2) include values that correspond to the difference between the values obtained by the reconstruction calculations a, b, c, etc. for the items in document (2), i.e., values corresponding to the relationship between document (2) and other documents (e.g., document (1), document (3), etc.). Furthermore, the explanatory variables for document (3) include values that correspond to the difference between the values obtained by the reconstruction calculations a, b, c, etc. for the items in document (3), i.e., values corresponding to the relationship between document (3) and other documents (e.g., document (1), document (2), etc.). The same is true for each case (resident B, etc.).

情報処理装置1では、このような説明変数を含む学習用データ70をもとに機械学習を行うことで、各文書間の関係性を学習した学習モデル71を生成することができる。 In the information processing device 1, machine learning is performed based on the learning data 70 that includes such explanatory variables, thereby generating a learning model 71 that has learned the relationships between each document.

図3に戻り、S1についで、情報処理装置1では、生成した学習モデル71に未修正資料データ12を適用し、未修正資料データ12に含まれる各文書に関する修正の有無を判定する判定処理を行う(S2)。これにより、情報処理装置1は、各文書に関する修正の有無を示す判定結果81を得て、処理を終了する。 Returning to FIG. 3, following S1, the information processing device 1 applies the uncorrected material data 12 to the generated learning model 71, and performs a determination process to determine whether or not each document included in the uncorrected material data 12 has been corrected (S2). As a result, the information processing device 1 obtains a determination result 81 indicating whether or not each document has been corrected, and ends the process.

図6は、実施形態にかかる情報処理装置1の判定処理の一例を示すフローチャートである。図6に示すように、判定処理が開始されると、復元演算計算部31は、未修正資料データ12に含まれる判定対象の事例(住民)について、提出された各書類(資料)の値を取得する。ついで、復元演算計算部31は、復元演算定義情報41の定義内容に基づいて、特定の文書と、その文書とは別にある他の文書の項目の値より復元演算を行う(S20)。 Figure 6 is a flowchart showing an example of the judgment process of the information processing device 1 according to the embodiment. As shown in Figure 6, when the judgment process is started, the restoration calculation unit 31 obtains the values of each document (document) submitted for the case (resident) to be judged that is included in the uncorrected document data 12. Next, the restoration calculation unit 31 performs a restoration calculation from the values of items of a specific document and another document separate from that document, based on the definition contents of the restoration calculation definition information 41 (S20).

ついで、差分計算部32は、復元演算計算部31による復元演算結果と、資料の値との差分を計算し(S31)、この計算結果を説明変数として評価用データ80に格納する(S32)。 Then, the difference calculation unit 32 calculates the difference between the reconstruction calculation result by the reconstruction calculation unit 31 and the value of the material (S31), and stores this calculation result in the evaluation data 80 as an explanatory variable (S32).

ついで、説明変数生成部30は、判定対象の事例に含まれる全ての資料について説明変数を生成する処理を終了したか否かを判定する(S33)。判定対象の事例に含まれる全ての資料について処理を終了していない場合(S33:No)、説明変数生成部30は、S30へ処理を戻す。 Next, the explanatory variable generation unit 30 judges whether the process of generating explanatory variables for all materials included in the case to be judged has been completed (S33). If the process has not been completed for all materials included in the case to be judged (S33: No), the explanatory variable generation unit 30 returns the process to S30.

判定対象の事例に含まれる全ての資料について処理を終了した場合(S33:Yes)、説明変数生成部30は、復元演算定義情報41に定義された全ての復元演算を処理したか否かを判定する(S34)。全ての復元演算を処理していない場合(S34:No)、説明変数生成部30は、S30へ処理を戻す。 When processing has been completed for all materials included in the case to be judged (S33: Yes), the explanatory variable generation unit 30 judges whether or not all the reconstruction operations defined in the reconstruction operation definition information 41 have been processed (S34). When not all the reconstruction operations have been processed (S34: No), the explanatory variable generation unit 30 returns the process to S30.

全ての復元演算を処理した場合(S34:Yes)、説明変数生成部30は、資料の全ての項目について説明変数の生成に関する処理を行ったか否かを判定する(S35)。全ての項目について処理をしていない場合(S35:No)、説明変数生成部30は、S30へ処理を戻す。 If all the restoration calculations have been processed (S34: Yes), the explanatory variable generation unit 30 determines whether the process for generating explanatory variables has been performed for all items of the document (S35). If the process has not been performed for all items (S35: No), the explanatory variable generation unit 30 returns the process to S30.

全ての項目を処理した場合(S35:Yes)、説明変数生成部30は、判定対象の全ての住民(事例)を処理したか否かを判定する(S36)。全ての住民について処理をしていない場合(S36:No)、説明変数生成部30は、S30へ処理を戻す。 If all items have been processed (S35: Yes), the explanatory variable generation unit 30 determines whether all residents (cases) to be judged have been processed (S36). If not all residents have been processed (S36: No), the explanatory variable generation unit 30 returns to S30.

全ての住民を処理した場合(S36:Yes)、判定部60は、評価用データ80を学習モデル71に入力することで、判定対象の事例の各書類における修正の有無を判定して判定結果81を取得し(S37)、処理を終了する。 When all residents have been processed (S36: Yes), the judgment unit 60 inputs the evaluation data 80 into the learning model 71 to judge whether or not corrections have been made to each document of the case being judged, obtains the judgment result 81 (S37), and ends the process.

以上のように、情報処理装置1は、各文書の修正履歴を含む複数の事例の修正済資料データ11をもとに、事例ごとに、予め定義された復元演算に基づいて、特定の第1の文書に含まれる項目の値および特定の第2の文書に含まれる項目の値より演算した値と、第1の文書に含まれる項目の値との差分を含む説明変数を生成する。ついで、情報処理装置1は、生成した説明変数と、事例の各文書における修正履歴に対応する値を含む目的変数とに基づく機械学習により、学習モデル71を生成する。情報処理装置1は、この学習モデル71に対して、判定対象の各文書に基づいて学習時と同様に生成した説明変数を入力し、学習モデル71からの出力に基づいて、判定対象の各文書における修正の有無を出力する。 As described above, the information processing device 1 generates explanatory variables including the difference between a value calculated from the value of an item included in a specific first document and the value of an item included in a specific second document and the value of the item included in the first document, based on a predefined restoration calculation for each case, based on the corrected material data 11 of multiple cases including the revision history of each document. Next, the information processing device 1 generates a learning model 71 by machine learning based on the generated explanatory variables and a target variable including a value corresponding to the revision history of each document of the case. The information processing device 1 inputs explanatory variables generated in the same manner as during learning based on each document to be judged to this learning model 71, and outputs the presence or absence of revisions in each document to be judged based on the output from the learning model 71.

このように、判定に用いる学習モデル71に入力する説明変数には、特定の第1の文書に含まれる項目の値および特定の第2の文書に含まれる項目の値より復元演算した値と、第1の文書に含まれる項目との差分による文書間の関係性が含まれる。したがって、情報処理装置1では、この学習モデル71を用いて判定対象の各文書における修正の有無を得るので、文書間の関係性に対応して修正すべき文書を特定できる。 In this way, the explanatory variables input to the learning model 71 used for the judgment include values calculated from the values of items contained in a specific first document and the values of items contained in a specific second document, and the relationship between the documents based on the difference between the values and the items contained in the first document. Therefore, the information processing device 1 uses this learning model 71 to obtain the presence or absence of corrections in each document to be judged, and can identify documents that need to be corrected in accordance with the relationship between the documents.

また、情報処理装置1における復元演算は、異なる特定の文書間の項目の値の最大値を求める演算である。これにより、情報処理装置1では、異なる特定の文書間の項目の値の最大値を求める復元演算の結果と、第1の文書の値との差分により、0ならば第1の文書の値が最大値、0以外ならば他の文書の値のいずれかが最大値となるような、文書間の関係性を示す特徴量を説明変数に含めることができる。例えば、典型的な文書の分かれ方の一例として、ある文書(例えば第1の文書)の値が他の文書(例えば第2の文書)の値に包括されているようなケースがある。情報処理装置1では、上記の復元演算により、このようなケースに関する特徴量を説明変数に含めることができる。 In addition, the restoration calculation in the information processing device 1 is a calculation that finds the maximum value of the values of items between different specific documents. As a result, the information processing device 1 can include in the explanatory variables a feature that indicates the relationship between the documents, such that if the difference between the result of the restoration calculation that finds the maximum value of the values of items between different specific documents and the value of the first document is 0, the value of the first document is the maximum, and if the difference is not 0, one of the values of the other documents is the maximum. For example, one example of a typical way in which documents are separated is a case in which the value of a certain document (e.g., the first document) is contained in the value of another document (e.g., the second document). In the information processing device 1, the above restoration calculation can include in the explanatory variables a feature related to such a case.

また、情報処理装置1における復元演算は、異なる特定の文書間の項目の値の合計値を求める演算である。これにより、情報処理装置1では、異なる特定の文書間の項目の値の合計値を求める復元演算の結果と、第1の文書の値との差分により、0ならば第1の文書のみ正の値であり、0以外ならば他の文書にも正の値があるような、文書間の関係性を示す特徴量を説明変数に含めることができる。例えば、典型的な文書の分かれ方の一例として、別々の文書に値が形状されており、値が重複しないようなケースがある。情報処理装置1では、上記の復元演算により、このようなケースに関する特徴量を説明変数に含めることができる。 In addition, the restoration calculation in the information processing device 1 is a calculation that finds the sum of the values of items between different specific documents. As a result, in the information processing device 1, the difference between the result of the restoration calculation that finds the sum of the values of items between different specific documents and the value of the first document can be included in the explanatory variables as a feature that indicates the relationship between the documents, such that if the value is 0, only the first document has a positive value, and if the value is non-zero, the other documents also have positive values. For example, one example of a typical way in which documents are separated is a case in which values are shaped in different documents and do not overlap. In the information processing device 1, the above restoration calculation can be used to include a feature related to such a case in the explanatory variables.

また、情報処理装置1における復元演算は、異なる特定の文書間の項目の値の合計値から第1の文書か第2の文書のいずれかに含まれる特定の第3の文書の項目の値を減算する演算である。これにより、情報処理装置1では、異なる特定の文書間の項目の値の合計値から第3の文書の項目の値を減算する復元演算の結果と、第1の文書の値との差分により、0ならば第1の文書と減算対象の第3の文書のみの値が正であり、0以外ならば他の文書にも正の値があるか、この文書が第3の文書か値が0かのいずれかのような、文書間の関係性を示す特徴量を説明変数に含めることができる。例えば、典型的な文書の分かれ方の一例として、特定の文書に別の項目の値を誤記載するようなケースがある。情報処理装置1では、上記の復元演算により、このようなケースに関する特徴量を説明変数に含めることができる。 In addition, the restoration calculation in the information processing device 1 is a calculation that subtracts the value of an item of a specific third document included in either the first document or the second document from the total value of the values of items between different specific documents. As a result, in the information processing device 1, depending on the difference between the result of the restoration calculation that subtracts the value of the item of the third document from the total value of the values of items between different specific documents and the value of the first document, if the difference is 0, then only the values of the first document and the third document to be subtracted are positive, and if the difference is other than 0, then either the other document also has a positive value, or this document is a third document or the value is 0, then the explanatory variable can include a feature that indicates the relationship between the documents. For example, a typical example of how documents are divided is a case where a value of another item is erroneously written in a specific document. In the information processing device 1, the above restoration calculation can include a feature related to such a case in the explanatory variable.

また、情報処理装置1における第1の文書および第2の文書は同一の種別の文書である。これにより、情報処理装置1では、同一の種別の文書間の関係性より、修正すべき文書を特定できる。 In addition, the first document and the second document in the information processing device 1 are documents of the same type. This allows the information processing device 1 to identify the document to be corrected based on the relationship between documents of the same type.

(その他)
なお、図示した各装置の各構成要素は、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。例えば、情報処理装置1については、学習モデル71を生成する構成と、生成した学習モデル71をもとに判定する構成とを分散してもよい。
(others)
Note that each component of each device shown in the figure does not necessarily have to be physically configured as shown in the figure. In other words, the specific form of distribution and integration of each device is not limited to that shown in the figure, and all or part of them can be functionally or physically distributed and integrated in any unit depending on various loads, usage conditions, etc. For example, for the information processing device 1, a configuration for generating a learning model 71 and a configuration for making a judgment based on the generated learning model 71 may be distributed.

また、情報処理装置1の各種処理機能(入力部10、目的変数生成部20、説明変数生成部30、学習部50および判定部60)は、CPU(またはMPU、MCU(Micro Controller Unit)等のマイクロ・コンピュータ)上で、その全部または任意の一部を実行するようにしてもよい。また、各種処理機能は、CPU(またはMPU、MCU等のマイクロ・コンピュータ)で解析実行されるプログラム上、またはワイヤードロジックによるハードウエア上で、その全部または任意の一部を実行するようにしてもよいことは言うまでもない。また、情報処理装置1で行われる各種処理機能は、クラウドコンピューティングにより、複数のコンピュータが協働して実行してもよい。 Furthermore, the various processing functions of the information processing device 1 (the input unit 10, the objective variable generation unit 20, the explanatory variable generation unit 30, the learning unit 50, and the judgment unit 60) may be executed in whole or in part on a CPU (or a microcomputer such as an MPU or an MCU (Micro Controller Unit)). Needless to say, the various processing functions may be executed in whole or in part on a program that is analyzed and executed by the CPU (or a microcomputer such as an MPU or an MCU), or on hardware using wired logic. Furthermore, the various processing functions performed by the information processing device 1 may be executed by multiple computers working together using cloud computing.

(コンピュータ構成例)
ところで、上記の実施形態で説明した各種の処理は、予め用意されたプログラムをコンピュータで実行することで実現できる。そこで、以下では、上記の実施形態と同様の機能を有するプログラムを実行するコンピュータ構成(ハードウエア)の一例を説明する。図7は、コンピュータ構成の一例を示すブロック図である。
(Example of computer configuration)
The various processes described in the above embodiment can be realized by executing a program prepared in advance on a computer. Therefore, an example of a computer configuration (hardware) that executes a program having the same functions as those of the above embodiment will be described below. Fig. 7 is a block diagram showing an example of the computer configuration.

図7に示すように、コンピュータ200は、各種演算処理を実行するCPU201と、データ入力を受け付ける入力装置202と、モニタ203と、スピーカー204とを有する。また、コンピュータ200は、記憶媒体からプログラム等を読み取る媒体読取装置205と、各種装置と接続するためのインタフェース装置206と、有線または無線により外部機器と通信接続するための通信装置207とを有する。また、情報処理装置1は、各種情報を一時記憶するRAM208と、ハードディスク装置209とを有する。また、コンピュータ200内の各部(201~209)は、バス210に接続される。 As shown in FIG. 7, the computer 200 has a CPU 201 that executes various arithmetic processes, an input device 202 that accepts data input, a monitor 203, and a speaker 204. The computer 200 also has a medium reading device 205 that reads programs and the like from a storage medium, an interface device 206 for connecting to various devices, and a communication device 207 for connecting to external devices via wired or wireless communication. The information processing device 1 also has a RAM 208 that temporarily stores various information, and a hard disk device 209. Each unit (201 to 209) in the computer 200 is connected to a bus 210.

ハードディスク装置209には、上記の実施形態で説明した機能構成(例えば入力部10、目的変数生成部20、説明変数生成部30、学習部50および判定部60)における各種の処理を実行するためのプログラム211が記憶される。また、ハードディスク装置209には、プログラム211が参照する各種データ212が記憶される。入力装置202は、例えば、操作者から操作情報の入力を受け付ける。モニタ203は、例えば、操作者が操作する各種画面を表示する。インタフェース装置206は、例えば印刷装置等が接続される。通信装置207は、LAN(Local Area Network)等の通信ネットワークと接続され、通信ネットワークを介した外部機器との間で各種情報をやりとりする。 The hard disk drive 209 stores a program 211 for executing various processes in the functional configuration (e.g., the input unit 10, the objective variable generating unit 20, the explanatory variable generating unit 30, the learning unit 50, and the judgment unit 60) described in the above embodiment. The hard disk drive 209 also stores various data 212 referenced by the program 211. The input device 202, for example, accepts input of operation information from an operator. The monitor 203, for example, displays various screens operated by the operator. The interface device 206 is connected to, for example, a printing device. The communication device 207 is connected to a communication network such as a LAN (Local Area Network), and exchanges various information with external devices via the communication network.

CPU201は、ハードディスク装置209に記憶されたプログラム211を読み出して、RAM208に展開して実行することで、上記の機能構成(例えば入力部10、目的変数生成部20、説明変数生成部30、学習部50および判定部60)に関する各種の処理を行う。なお、プログラム211は、ハードディスク装置209に記憶されていなくてもよい。例えば、コンピュータ200が読み取り可能な記憶媒体に記憶されたプログラム211を読み出して実行するようにしてもよい。コンピュータ200が読み取り可能な記憶媒体は、例えば、CD-ROMやDVDディスク、USB(Universal Serial Bus)メモリ等の可搬型記録媒体、フラッシュメモリ等の半導体メモリ、ハードディスクドライブ等が対応する。また、公衆回線、インターネット、LAN等に接続された装置にこのプログラム211を記憶させておき、コンピュータ200がこれらからプログラム211を読み出して実行するようにしてもよい。 The CPU 201 reads out the program 211 stored in the hard disk drive 209, expands it in the RAM 208, and executes it to perform various processes related to the above-mentioned functional configuration (for example, the input unit 10, the objective variable generating unit 20, the explanatory variable generating unit 30, the learning unit 50, and the judgment unit 60). The program 211 does not have to be stored in the hard disk drive 209. For example, the program 211 stored in a storage medium that the computer 200 can read out and execute may be read out and executed. Examples of storage media that the computer 200 can read out include portable storage media such as CD-ROMs, DVD disks, USB (Universal Serial Bus) memories, semiconductor memories such as flash memories, and hard disk drives. The program 211 may also be stored in a device connected to a public line, the Internet, a LAN, or the like, and the computer 200 may read out and execute the program 211 from the device.

以上の実施形態に関し、さらに以下の付記を開示する。 The following notes are further provided with respect to the above embodiment.

(付記1)各文書の修正履歴を含む複数の事例の学習用データをもとに、前記事例ごとに、予め定義された復元演算に基づいて特定の第1の文書に含まれる項目の値および特定の第2の文書に含まれる項目の値より演算した値と、前記第1の文書に含まれる項目の値との差分を含む説明変数と、前記事例の各文書における修正履歴に対応する値を含む目的変数とに基づいて機械学習したモデルに対して、判定対象の各文書に基づいて生成した前記説明変数を入力し、
前記モデルからの出力に基づいて、前記判定対象の各文書における修正の有無を出力する、
処理をコンピュータに実行させることを特徴とする文書修正支援プログラム。
(Supplementary Note 1) Based on learning data of a plurality of cases including the revision history of each document, a machine learning model is generated based on explanatory variables including a difference between a value calculated from a value of an item included in a specific first document and a value of an item included in a specific second document based on a predefined restoration calculation for each of the cases and the value of the item included in the first document, and a target variable including a value corresponding to the revision history of each document of the cases, and the explanatory variables generated based on each document to be judged are input to the model;
outputting whether or not each document to be judged has been modified based on the output from the model;
A document correction support program for causing a computer to execute a process.

(付記2)前記復元演算は、異なる特定の文書間の項目の値の最大値を求める演算である、
ことを特徴とする付記1に記載の文書修正支援プログラム。
(Note 2) The restoration operation is an operation for finding the maximum value of item values between different specific documents.
2. The document correction support program according to claim 1,

(付記3)前記復元演算は、異なる特定の文書間の項目の値の合計値を求める演算である、
ことを特徴とする付記1に記載の文書修正支援プログラム。
(Additional Note 3) The restoration operation is an operation for calculating the sum of values of items between different specific documents.
2. The document correction support program according to claim 1,

(付記4)前記復元演算は、異なる特定の文書間の項目の値の合計値から前記第1の文書か前記第2の文書のいずれかに含まれる特定の第3の文書の項目の値を減算する演算である、
ことを特徴とする付記1に記載の文書修正支援プログラム。
(Additional Note 4) The restoration operation is an operation of subtracting a value of an item of a specific third document included in either the first document or the second document from a total value of values of items between different specific documents.
2. The document correction support program according to claim 1,

(付記5)前記第1の文書および前記第2の文書は同一の種別の文書である、
ことを特徴とする付記1乃至4のいずれか一に記載の文書修正支援プログラム。
(Supplementary Note 5) The first document and the second document are documents of the same type.
5. A document correction support program according to claim 1,

(付記6)各文書の修正履歴を含む複数の事例の学習用データをもとに、前記事例ごとに、予め定義された復元演算に基づいて特定の第1の文書に含まれる項目の値および特定の第2の文書に含まれる項目の値より演算した値と、前記第1の文書に含まれる項目の値との差分を含む説明変数と、前記事例の各文書における修正履歴に対応する値を含む目的変数とに基づいて機械学習したモデルに対して、判定対象の各文書に基づいて生成した前記説明変数を入力し、
前記モデルからの出力に基づいて、前記判定対象の各文書における修正の有無を出力する、
処理をコンピュータが実行することを特徴とする文書修正支援方法。
(Supplementary Note 6) Based on learning data of a plurality of cases including the revision history of each document, a machine learning model is generated based on explanatory variables including a difference between a value calculated from a value of an item included in a specific first document and a value of an item included in a specific second document based on a predefined restoration calculation for each of the cases and the value of the item included in the first document, and a target variable including a value corresponding to the revision history of each document of the cases. The explanatory variables generated based on each document to be judged are input to the model;
outputting whether or not each document to be judged has been modified based on the output from the model;
A document correction support method, comprising the steps of: executing a process on a computer;

(付記7)前記復元演算は、異なる特定の文書間の項目の値の最大値を求める演算である、
ことを特徴とする付記6に記載の文書修正支援方法。
(Additional Note 7) The restoration operation is an operation for finding the maximum value of item values between different specific documents.
7. The document correction support method according to claim 6,

(付記8)前記復元演算は、異なる特定の文書間の項目の値の合計値を求める演算である、
ことを特徴とする付記6に記載の文書修正支援方法。
(Additional Note 8) The restoration operation is an operation for calculating the sum of values of items between different specific documents.
7. The document correction support method according to claim 6,

(付記9)前記復元演算は、異なる特定の文書間の項目の値の合計値から前記第1の文書か前記第2の文書のいずれかに含まれる特定の第3の文書の項目の値を減算する演算である、
ことを特徴とする付記6に記載の文書修正支援方法。
(Supplementary Note 9) The restoration operation is an operation of subtracting a value of an item of a specific third document included in either the first document or the second document from a total value of values of items between different specific documents.
7. The document correction support method according to claim 6,

(付記10)前記第1の文書および前記第2の文書は同一の種別の文書である、
ことを特徴とする付記6乃至9のいずれか一に記載の文書修正支援方法。
(Supplementary Note 10) The first document and the second document are documents of the same type.
10. The document correction support method according to claim 6,

(付記11)各文書の修正履歴を含む複数の事例の学習用データをもとに、前記事例ごとに、予め定義された復元演算に基づいて特定の第1の文書に含まれる項目の値および特定の第2の文書に含まれる項目の値より演算した値と、前記第1の文書に含まれる項目の値との差分を含む説明変数と、前記事例の各文書における修正履歴に対応する値を含む目的変数とに基づいて機械学習したモデルに対して、判定対象の各文書に基づいて生成した前記説明変数を入力し、
前記モデルからの出力に基づいて、前記判定対象の各文書における修正の有無を出力する、
処理を制御部が実行することを特徴とする情報処理装置。
(Supplementary Note 11) Based on learning data of a plurality of cases including the revision history of each document, a machine learning model is generated based on explanatory variables including a difference between a value calculated from a value of an item included in a specific first document and a value of an item included in a specific second document based on a predefined restoration calculation for each of the cases and the value of the item included in the first document, and a target variable including a value corresponding to the revision history of each document of the cases, and the explanatory variables generated based on each document to be judged are input to the model;
outputting whether or not each document to be judged has been modified based on the output from the model;
An information processing device characterized in that a control unit executes processing.

(付記12)前記復元演算は、異なる特定の文書間の項目の値の最大値を求める演算である、
ことを特徴とする付記11に記載の情報処理装置。
(Additional Note 12) The restoration operation is an operation for finding the maximum value of item values between different specific documents.
12. The information processing device according to claim 11.

(付記13)前記復元演算は、異なる特定の文書間の項目の値の合計値を求める演算である、
ことを特徴とする付記11に記載の情報処理装置。
(Additional Note 13) The restoration operation is an operation for calculating the sum of values of items between different specific documents.
12. The information processing device according to claim 11.

(付記14)前記復元演算は、異なる特定の文書間の項目の値の合計値から前記第1の文書か前記第2の文書のいずれかに含まれる特定の第3の文書の項目の値を減算する演算である、
ことを特徴とする付記11に記載の情報処理装置。
(Supplementary Note 14) The restoration operation is an operation of subtracting a value of an item of a specific third document included in either the first document or the second document from a total value of values of items between different specific documents.
12. The information processing device according to claim 11.

(付記15)前記第1の文書および前記第2の文書は同一の種別の文書である、
ことを特徴とする付記11乃至14のいずれか一に記載の情報処理装置。
(Supplementary Note 15) The first document and the second document are documents of the same type.
15. The information processing device according to any one of claims 11 to 14.

1…情報処理装置
10…入力部
11…修正済資料データ
12…未修正資料データ
20…目的変数生成部
30…説明変数生成部
31…復元演算計算部
32…差分計算部
40…記憶部
41…復元演算定義情報
50…学習部
60…判定部
70…学習用データ
71…学習モデル
80…評価用データ
81…判定結果
200…コンピュータ
201…CPU
202…入力装置
203…モニタ
204…スピーカー
205…媒体読取装置
206…インタフェース装置
207…通信装置
208…RAM
209…ハードディスク装置
210…バス
211…プログラム
212…各種データ
D1…確定申告書
D2…住民税申告書
D3、D4…給与支払報告書
D5…年金支払報告書
H1…住民
H2…職員
K1、K2…勤務先
K3…年金機構
1... Information processing device 10... Input unit 11... Corrected material data 12... Uncorrected material data 20... Objective variable generation unit 30... Explanatory variable generation unit 31... Restoration calculation calculation unit 32... Difference calculation unit 40... Storage unit 41... Restoration calculation definition information 50... Learning unit 60... Judgment unit 70... Learning data 71... Learning model 80... Evaluation data 81... Judgment result 200... Computer 201... CPU
202: Input device 203: Monitor 204: Speaker 205: Media reader 206: Interface device 207: Communication device 208: RAM
209...Hard disk device 210...Bus 211...Program 212...Various data D1...Final tax return D2...Resident tax return D3, D4...Salary payment report D5...Pension payment report H1...Resident H2...Employee K1, K2...Employee K3...Pension Service

Claims (7)

各文書の修正履歴を含む複数の事例の学習用データをもとに、前記事例ごとに、予め定義された復元演算に基づいて特定の第1の文書に含まれる項目の値および特定の第2の文書に含まれる項目の値より演算した値と、前記第1の文書に含まれる項目の値との差分を含む説明変数と、前記事例の各文書における修正履歴に対応する値を含む目的変数とに基づいて機械学習したモデルに対して、判定対象の各文書に基づいて生成した前記説明変数を入力し、
前記モデルからの出力に基づいて、前記判定対象の各文書における修正の有無を出力する、
処理をコンピュータに実行させることを特徴とする文書修正支援プログラム。
a machine learning model based on learning data of a plurality of cases including the revision history of each document, for each of the cases, an explanatory variable including a difference between a value calculated from a value of an item included in a specific first document and a value of an item included in a specific second document based on a predefined restoration calculation and the value of the item included in the first document, and a target variable including a value corresponding to the revision history of each document of the cases, the explanatory variables generated based on each document to be determined are input to the machine learning model;
outputting whether or not each document to be judged has been modified based on the output from the model;
A document correction support program for causing a computer to execute a process.
前記復元演算は、異なる特定の文書間の項目の値の最大値を求める演算である、
ことを特徴とする請求項1に記載の文書修正支援プログラム。
The restoration operation is an operation for finding the maximum value of item values among different specific documents.
2. The document correction support program according to claim 1.
前記復元演算は、異なる特定の文書間の項目の値の合計値を求める演算である、
ことを特徴とする請求項1に記載の文書修正支援プログラム。
The restoration operation is an operation for calculating a sum of values of items among different specific documents.
2. The document correction support program according to claim 1.
前記復元演算は、異なる特定の文書間の項目の値の合計値から前記第1の文書か前記第2の文書のいずれかに含まれる特定の第3の文書の項目の値を減算する演算である、
ことを特徴とする請求項1に記載の文書修正支援プログラム。
The restoration operation is an operation of subtracting a value of an item of a specific third document included in either the first document or the second document from a total value of values of items among different specific documents.
2. The document correction support program according to claim 1.
前記第1の文書および前記第2の文書は同一の種別の文書である、
ことを特徴とする請求項1乃至4のいずれか一項に記載の文書修正支援プログラム。
the first document and the second document are documents of the same type;
5. The document correction support program according to claim 1,
各文書の修正履歴を含む複数の事例の学習用データをもとに、前記事例ごとに、予め定義された復元演算に基づいて特定の第1の文書に含まれる項目の値および特定の第2の文書に含まれる項目の値より演算した値と、前記第1の文書に含まれる項目の値との差分を含む説明変数と、前記事例の各文書における修正履歴に対応する値を含む目的変数とに基づいて機械学習したモデルに対して、判定対象の各文書に基づいて生成した前記説明変数を入力し、
前記モデルからの出力に基づいて、前記判定対象の各文書における修正の有無を出力する、
処理をコンピュータが実行することを特徴とする文書修正支援方法。
a machine learning model based on learning data of a plurality of cases including the revision history of each document, for each of the cases, an explanatory variable including a difference between a value calculated from a value of an item included in a specific first document and a value of an item included in a specific second document based on a predefined restoration calculation and the value of the item included in the first document, and a target variable including a value corresponding to the revision history of each document of the cases, the explanatory variables generated based on each document to be determined are input to the machine learning model;
outputting whether or not each document to be judged has been modified based on the output from the model;
A document correction support method, comprising the steps of: executing a process on a computer;
各文書の修正履歴を含む複数の事例の学習用データをもとに、前記事例ごとに、予め定義された復元演算に基づいて特定の第1の文書に含まれる項目の値および特定の第2の文書に含まれる項目の値より演算した値と、前記第1の文書に含まれる項目の値との差分を含む説明変数と、前記事例の各文書における修正履歴に対応する値を含む目的変数とに基づいて機械学習したモデルに対して、判定対象の各文書に基づいて生成した前記説明変数を入力し、
前記モデルからの出力に基づいて、前記判定対象の各文書における修正の有無を出力する、
処理を制御部が実行することを特徴とする情報処理装置。
a machine learning model based on learning data of a plurality of cases including the revision history of each document, for each of the cases, an explanatory variable including a difference between a value calculated from a value of an item included in a specific first document and a value of an item included in a specific second document based on a predefined restoration calculation and the value of the item included in the first document, and a target variable including a value corresponding to the revision history of each document of the cases, the explanatory variables generated based on each document to be determined are input to the machine learning model;
outputting whether or not each document to be judged has been modified based on the output from the model;
An information processing device characterized in that a control unit executes processing.
JP2022023005A 2022-02-17 2022-02-17 Document correction support program, document correction support method, and information processing device Active JP7704045B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2022023005A JP7704045B2 (en) 2022-02-17 2022-02-17 Document correction support program, document correction support method, and information processing device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2022023005A JP7704045B2 (en) 2022-02-17 2022-02-17 Document correction support program, document correction support method, and information processing device

Publications (2)

Publication Number Publication Date
JP2023119888A JP2023119888A (en) 2023-08-29
JP7704045B2 true JP7704045B2 (en) 2025-07-08

Family

ID=87778220

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022023005A Active JP7704045B2 (en) 2022-02-17 2022-02-17 Document correction support program, document correction support method, and information processing device

Country Status (1)

Country Link
JP (1) JP7704045B2 (en)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006344012A (en) 2005-06-09 2006-12-21 Toshiba Corp Data input system, data input program
JP2010134766A (en) 2008-12-05 2010-06-17 Toshiba Corp Document data processing apparatus and program thereof
JP2021114120A (en) 2020-01-17 2021-08-05 株式会社日立製作所 Ambiguous part correction support device and method

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006344012A (en) 2005-06-09 2006-12-21 Toshiba Corp Data input system, data input program
JP2010134766A (en) 2008-12-05 2010-06-17 Toshiba Corp Document data processing apparatus and program thereof
JP2021114120A (en) 2020-01-17 2021-08-05 株式会社日立製作所 Ambiguous part correction support device and method

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
谷口 裕子、外2名,文脈を考慮した業務文書の数値不整合チェック技術,東芝レビュー,日本,株式会社東芝,2008年02月01日,第63巻,第2号,p.70-73

Also Published As

Publication number Publication date
JP2023119888A (en) 2023-08-29

Similar Documents

Publication Publication Date Title
US11327935B2 (en) Intelligent data quality
JP2022534933A5 (en)
US20230072297A1 (en) Knowledge graph based reasoning recommendation system and method
US20150154698A1 (en) Hybridization of Personal and Business Credit and Credibility
US20250139374A1 (en) Automated evaluation of large language models
JP2023515640A (en) Manufacture or control of technical systems with optimized parameter sets
US8576430B2 (en) Job schedule generation using historical decision database
Hrabovskyi et al. Development of an information support methodology for quality assessment of the prepress process
CN114398059A (en) Parameter update method, device, device and storage medium
JP5405684B1 (en) Source program programming language converter
JP7704045B2 (en) Document correction support program, document correction support method, and information processing device
JP7512764B2 (en) Learning device, judgment device, learning method, judgment method, learning program, and judgment program
Jiang et al. An examination of the factors influencing software development effort
KR102767248B1 (en) Method and apparatus for assessment of money laundering suspicious transaction risk
CN111242320A (en) Machine learning method and device, electronic equipment and storage medium
CN110110906B (en) Efron approximate optimization-based survival risk modeling method
US20250356415A1 (en) Modeling improvements for complex data verification
JP7783218B2 (en) Business support device, business support method, and business support program
JP2020204963A (en) Workflow system, information processing device, information processing method, and program
JP7702726B2 (en) Credit information generating device and credit information generating method
US11948207B1 (en) Machine learning based approach for recommending different categories of tax deductible expenses and related examples of tax deductible expenses for each category
JP7507062B2 (en) Apparatus and method for supporting product verification
Koch et al. Identifying and Dealing with Interdependencies and Conflicts between Goals in Manufacturing Companies’ Sustainability Measures. Sustainability 2024, 16, 3817
CN111859099B (en) Recommendation method, device, terminal and storage medium based on reinforcement learning
WO2025225012A1 (en) Information processing device, information processing method, and information processing program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20241010

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20250430

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20250527

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20250609

R150 Certificate of patent or registration of utility model

Ref document number: 7704045

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150