JP7397766B2 - Information processing device, information processing method and program - Google Patents
Information processing device, information processing method and program Download PDFInfo
- Publication number
- JP7397766B2 JP7397766B2 JP2020106490A JP2020106490A JP7397766B2 JP 7397766 B2 JP7397766 B2 JP 7397766B2 JP 2020106490 A JP2020106490 A JP 2020106490A JP 2020106490 A JP2020106490 A JP 2020106490A JP 7397766 B2 JP7397766 B2 JP 7397766B2
- Authority
- JP
- Japan
- Prior art keywords
- item
- data
- combination
- name
- destination
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims description 64
- 238000003672 processing method Methods 0.000 title claims description 9
- 238000000034 method Methods 0.000 claims description 245
- 238000012545 processing Methods 0.000 claims description 124
- 230000008569 process Effects 0.000 claims description 67
- 238000004364 calculation method Methods 0.000 claims description 51
- 238000012015 optical character recognition Methods 0.000 claims description 7
- 238000012546 transfer Methods 0.000 claims description 6
- 230000002776 aggregation Effects 0.000 claims description 3
- 238000004220 aggregation Methods 0.000 claims description 3
- 238000013439 planning Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 54
- 238000012367 process mapping Methods 0.000 description 30
- 238000013507 mapping Methods 0.000 description 22
- 238000012986 modification Methods 0.000 description 15
- 230000004048 modification Effects 0.000 description 14
- 238000004891 communication Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 6
- 238000012937 correction Methods 0.000 description 5
- 238000004590 computer program Methods 0.000 description 4
- 238000013461 design Methods 0.000 description 3
- 238000007792 addition Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000004931 aggregating effect Effects 0.000 description 1
- 238000013497 data interchange Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、情報処理装置、情報処理方法およびプログラムに関する。 The present invention relates to an information processing device, an information processing method, and a program.
昨今、電子データ(例えば、OCR(Optical Character Recognition)により電子化されたもの、または外部取込された(例えばEDI(Electronic Data Interchange)によりデータベースへ取り込まれた)もの、など)をERP(Enterprise Resource Planning)に係るアプリケーションソフトウェアに自動的に連結させることが可能となってきている。そして、外部データをERPに取り込む際に、外部データに対しERP内で使用されているコード(具体的にはERP内で使用されている各種マスタ中の主キー項目に係る値)を付与する「名寄せ」(情報処理)が必要となる。つまり、名寄せの需要が高まってきている。 Recently, electronic data (e.g., data digitized by OCR (Optical Character Recognition) or data imported externally (e.g. imported into a database by EDI (Electronic Data Interchange)) is being processed into ERP (Enterprise Research). ce It has become possible to automatically connect to application software related to planning. When importing external data into ERP, codes used in ERP (specifically, values related to primary key items in various masters used in ERP) are assigned to the external data. "Name identification" (information processing) is required. In other words, the demand for name matching is increasing.
従来の名寄せシステムは、特定の名寄せ場面での使用を想定したものとなっている。従来の名寄せシステムの一例として、同一人物による債権情報を検索する目的で債権情報の名寄せを行うシステム、バージョンが異なることによるソフトウェア名の表記ゆれを吸収してソフトウェアを正しく管理する目的でソフトウェア名の名寄せを行うシステム、CRM(Customer Relationship Management)において対象の企業を企業名と周辺情報から正しく検索する目的で企業名の名寄せを行うシステム、帳票における企業名にERP内で使用されている得意先マスタ中の得意先コード(主キー項目に係る値)を付与する企業名の名寄せに係るシステム、または、注文書における商品名にERP内で使用されている商品マスタ中の商品コード(主キー項目に係る値)を付与する商品名の名寄せに係るシステムが挙げられる。 Conventional name matching systems are designed to be used in specific name matching situations. Examples of conventional name aggregation systems include a system that combines name receivables to search for receivables by the same person, and a system that combines software names to manage software correctly by absorbing variations in software name notation due to different versions. A system that performs name matching, a system that performs name matching for the purpose of correctly searching for a target company from the company name and surrounding information in CRM (Customer Relationship Management), and a customer master database used in ERP for the company name in the form. A system for aggregating company names that assigns customer codes (values related to primary key items) in An example of this is a system related to name matching of product names that assigns such values.
なお、特許文献1には、ソースコードの修正を行うこと無く保険料計算式の追加、変更、削除を可能とする保険料算出システムが開示されている。
Note that
しかしながら、ERPでは、多種多様なデータを扱うため、名寄せ場面も多種多様となる。そのため、従来のように名寄せ場面ごとに名寄せシステムを設計・開発することは非効率であると考えられる。 However, since ERP handles a wide variety of data, the situations for name matching are also diverse. Therefore, it is considered inefficient to design and develop a name matching system for each name matching situation, as has been the case in the past.
本発明は、上記に鑑みてなされたものであって、多種多様な名寄せ場面(具体的には名寄せ元データ(例:帳票データ)と名寄せ先データ(例:マスタ)との組み合わせ)に応じた名寄せフローを、名寄せ場面ごとに設計・開発することなくコーディングレスで作成・実行することができる情報処理装置、情報処理方法およびプログラムを提供することを目的とする。 The present invention has been made in view of the above, and is capable of handling a wide variety of name matching situations (specifically, combinations of name matching source data (e.g., form data) and name matching destination data (e.g., master)). The purpose of the present invention is to provide an information processing device, an information processing method, and a program that can create and execute a name matching flow without having to design or develop a name matching flow for each name matching scene without coding.
上述した課題を解決し、目的を達成するために、本発明に係る情報処理装置は、制御部を備える情報処理装置であって、クレンジング手法と類似度計算手法との手法組み合わせが名寄せ先データの項目である先項目と紐付けて格納され、且つ、名寄せ元データの項目である元項目と先項目との項目組み合わせを1つまたは複数含む名寄せ実行時に使用する項目組み合わせ集合が名寄せ元データのテンプレートと紐付けて格納された記憶部にアクセス可能であり、前記制御部は、名寄せ元データと名寄せ先データを受け取る受取手段と、前記受け取った名寄せ元データのテンプレートに紐付く項目組み合わせ集合を、前記記憶部から取得し、取得した項目組み合わせ集合中の項目組み合わせごとに、当該項目組み合わせ中の先項目に紐付く手法組み合わせを、前記記憶部から取得する取得手段と、1)前記取得した項目組み合わせ集合中の項目組み合わせと前記取得した手法組み合わせとの組み合わせごとに、11)前記受け取った名寄せ元データが保持する、当該項目組み合わせ中の元項目に係る値と、前記受け取った名寄せ先データが保持する、当該項目組み合わせ中の先項目に係る値と、に対する、当該手法組み合わせ中のクレンジング手法によるクレンジング処理と、12)クレンジング処理後の両値に対する、当該手法組み合わせ中の類似度計算手法による類似度計算処理と、を実行し、2)当該得られた各類似度を集計し、3)当該得られた集計値に基づく情報と、当該名寄せ先データが保持する、名寄せ先データを一意に識別するための先項目である識別先項目に係る値を、名寄せ結果として出力する名寄せ実行手段と、を備えること、を特徴とする。 In order to solve the above-mentioned problems and achieve the purpose, an information processing device according to the present invention is an information processing device including a control unit, in which a method combination of a cleansing method and a similarity calculation method is applied to target data. The template of the source data is a set of item combinations that is stored in association with the destination item, which is an item, and is used when performing name matching, and contains one or more item combinations of the source item and destination item, which are the items of the source data. and a receiving means for receiving the comparison source data and the comparison destination data, and the item combination set linked to the template of the received comparison source data. an acquisition unit that acquires from the storage unit, for each item combination in the acquired item combination set, a method combination that is linked to a previous item in the item combination, from the storage unit; 1) the acquired item combination set; For each combination of the item combination in the middle and the acquired method combination, 11) the value related to the source item in the item combination held by the received name reference data and the value held by the received name reference data; 12) Cleansing processing using the cleansing method in the method combination for the value related to the previous item in the item combination, and 12) Similarity calculation processing using the similarity calculation method in the method combination for both values after the cleansing process. 2) aggregate each of the obtained similarities, and 3) calculate information based on the obtained aggregate value and uniquely identify the reference data held by the reference data. The present invention is characterized by comprising a name matching execution means for outputting a value related to an identification destination item, which is a destination item, as a name matching result.
また、本発明に係る情報処理装置において、前記記憶部は、重み付け値を先項目と紐付けてさらに格納し、前記取得手段は、前記取得した項目組み合わせ集合中の項目組み合わせごとに、当該項目組み合わせ中の先項目に紐付く重み付け値を、前記記憶部からさらに取得し、前記名寄せ実行手段は、各類似度に前記取得した各重み付け値を掛け合わせて各類似度を集計すること、を特徴とする。 Further, in the information processing device according to the present invention, the storage unit further stores the weighting value in association with the previous item, and the acquisition means stores the weighting value for each item combination in the acquired item combination set. A weighting value linked to a previous item in the item is further acquired from the storage unit, and the name matching execution means multiplies each degree of similarity by each of the acquired weighted values to total each degree of similarity. do.
また、本発明に係る情報処理装置において、前記名寄せ実行手段は、集計値と1つの閾値または互いに異なる複数の閾値との大小を比較し、比較結果に応じたコンテンツを、前記集計値に基づく情報として出力すること、を特徴とする。 Further, in the information processing device according to the present invention, the name matching execution means compares the total value with one threshold value or a plurality of mutually different threshold values, and selects content according to the comparison result from information based on the total value. It is characterized by outputting as .
また、本発明に係る情報処理装置において、前記名寄せ実行手段は、前記受け取った名寄せ先データが保持する、前記取得した項目組み合わせ集合中の先項目に係る値を、名寄せ結果としてさらに出力すること、を特徴とする。 Further, in the information processing device according to the present invention, the name matching execution means further outputs, as a name matching result, a value related to a previous item in the acquired item combination set, which is held by the received name matching destination data; It is characterized by
また、本発明に係る情報処理装置において、前記記憶部は、1)手法組み合わせを複数含む手法組み合わせ集合と、2)先項目と手法組み合わせの識別情報との先項目・手法組み合わせを、名寄せ先データ中の先項目の個数分含む先項目・手法組み合わせ集合を、名寄せ先データ別に複数含む先項目・手法組み合わせ集合族と、3)項目組み合わせ集合を1つまたは複数含む項目組み合わせ集合族と、4)項目組み合わせ集合の識別情報と先項目・手法組み合わせ集合の識別情報との組み合わせを1つまたは複数含む第一組み合わせ集合を1つまたは複数含む第一組み合わせ集合族と、5)第一組み合わせ集合の識別情報と名寄せ元データのテンプレートの識別情報との組み合わせを1つまたは複数含む第二組み合わせ集合と、を格納しているものであり、前記取得手段は、1)前記受け取った名寄せ元データ中のテンプレートの識別情報に紐付く第一組み合わせ集合の識別情報を、前記第二組み合わせ集合から取得し、2)前記取得した第一組み合わせ集合の識別情報で特定される第一組み合わせ集合を、前記第一組み合わせ集合族から取得し、3)前記取得した第一組み合わせ集合中の項目組み合わせ集合の識別情報で特定される項目組み合わせ集合を、前記項目組み合わせ集合族から取得するとともに、前記取得した第一組み合わせ集合中の先項目・手法組み合わせ集合の識別情報で特定される先項目・手法組み合わせ集合を、前記先項目・手法組み合わせ集合族から取得し、4)前記取得した先項目・手法組み合わせ集合から、前記取得した項目組み合わせ集合中の先項目に紐付く手法組み合わせを取得すること、を特徴とする。 Further, in the information processing device according to the present invention, the storage unit stores 1) a method combination set including a plurality of method combinations, and 2) a previous item/method combination of a previous item and identification information of the method combination, in the collation destination data. 3) an item combination set family containing one or more item combination sets, 4) 5) a first combination set family including one or more first combination sets including one or more combinations of identification information of the item combination set and identification information of the previous item/method combination set; and 5) identification of the first combination set. a second combination set including one or more combinations of information and identification information of the template of the reference data, and the acquisition means includes: 1) a template in the received reference data; 2) obtain the identification information of a first combination set linked to the identification information of the second combination set from the second combination set; 3) obtain an item combination set specified by the identification information of the item combination set in the obtained first combination set from the item combination set group; 4) obtain the previous item/method combination set specified by the identification information of the previous item/method combination set from the previous item/method combination set group; A feature of this method is to obtain a method combination that is linked to a previous item in a set of item combinations.
また、本発明に係る情報処理装置において、前記制御部は、クレンジング手法を設定させるための領域と、類似度計算手法を設定させるための領域とを含む第一の設定画面を介して、オペレータに、手法組み合わせを設定させる第一設定手段と、名寄せ先データを設定させるための領域と、設定された名寄せ先データ中の先項目を表示させるための領域と、先項目に適用する手法組み合わせを設定させるための領域と、を含む第二の設定画面を介して、オペレータに、先項目・手法組み合わせ集合を設定させる第二設定手段と、名寄せ元データのテンプレートを設定させるための領域と、名寄せ先データを設定させるための領域と、先項目・手法組み合わせ集合を設定させるための領域と、設定された名寄せ先データ中の先項目と設定されたテンプレート中の元項目とを表示させ、項目組み合わせ集合を設定させるための領域と、を含む第三の設定画面を介して、オペレータに、項目組み合わせ集合、名寄せ元データのテンプレートおよび先項目・手法組み合わせ集合の紐付けを設定させる第三設定手段と、をさらに備えること、を特徴とする。 Further, in the information processing device according to the present invention, the control unit allows the operator to set the cleansing method through a first setting screen that includes an area for setting a cleansing method and an area for setting a similarity calculation method. , a first setting means for setting a method combination, an area for setting reference data, an area for displaying a destination item in the set reference data, and setting a method combination to be applied to the destination item. a second setting screen that allows the operator to set a destination item/method combination set, an area for setting a template for the source data, and a second setting screen that includes An area for setting data, an area for setting a destination item/method combination set, a destination item in the set destination data and a source item in the set template are displayed, and the item combination set is displayed. a third setting means for causing the operator to set the item combination set, the template of the source data, and the linkage of the destination item/method combination set via a third setting screen including an area for setting the item combination set; It is characterized by further comprising:
また、本発明に係る情報処理装置において、前記記憶部は、名寄せ元データが保持する、項目組み合わせ集合中の元項目に係る値と、名寄せ先データが保持する識別先項目に係る値と、を紐付けて登録した辞書データをさらに格納し、前記制御部は、前記受け取った名寄せ元データが保持する、前記取得した項目組み合わせ集合中の元項目に係る値が、前記辞書データに登録されたものと同じである場合に、前記辞書データに登録された識別先項目に係る値と、当該値が前記辞書データに登録されたものであることを示す情報を、名寄せ結果として出力する辞書使用名寄せ実行手段をさらに備え、前記名寄せ実行手段は、前記受け取った名寄せ元データが保持する、前記取得した項目組み合わせ集合中の元項目に係る値が、前記辞書データに登録されたものと同じでなかった場合に、前記1)から前記3)の処理を実行すること、を特徴とする。 Further, in the information processing device according to the present invention, the storage unit stores a value related to the source item in the item combination set held by the name comparison source data and a value related to the identification destination item held by the name comparison destination data. The linked and registered dictionary data is further stored, and the control unit stores a value related to the original item in the acquired item combination set held by the received name matching source data that is registered in the dictionary data. is the same as the dictionary data, the value related to the identification item registered in the dictionary data and information indicating that the value is registered in the dictionary data are output as the matching result. The name matching execution means further comprises a means for performing name matching, when a value related to a source item in the acquired item combination set held by the received name matching source data is not the same as a value registered in the dictionary data. The method is characterized by executing the processes 1) to 3) above.
また、本発明に係る情報処理装置において、前記制御部は、前記名寄せ実行手段において、前記受け取った名寄せ元データが保持する、前記取得した項目組み合わせ集合中の元項目に係る値と、前記受け取った名寄せ先データが保持する識別先項目に係る値との特定の組み合わせが、所定回数以上記録された場合、当該特定の組み合わせの前記辞書データへの登録を提案するための情報を出力する提案情報出力手段をさらに備えること、を特徴とする。 Further, in the information processing device according to the present invention, the control unit, in the name matching execution means, obtains a value related to the original item in the acquired item combination set held by the received name matching source data, and a value related to the source item in the acquired item combination set, and When a specific combination with a value related to an identification item held in the identification destination data is recorded a predetermined number of times or more, output proposal information that outputs information for proposing registration of the specific combination in the dictionary data. The method further comprises means.
また、本発明に係る情報処理装置において、名寄せ元データと名寄せ先データは、ERP(Enterprise Resource Planning)に係るアプリケーションソフトウェアから転送されたものであり、前記出力は、名寄せ元データと名寄せ先データの転送元のERPに係るアプリケーションソフトウェアを出力先とするものであること、を特徴とする。 Furthermore, in the information processing device according to the present invention, the source data and destination data are transferred from application software related to ERP (Enterprise Resource Planning), and the output is a combination of the source data and destination data. It is characterized in that the output destination is application software related to the ERP of the transfer source.
また、本発明に係る情報処理装置において、名寄せ先データは、ERPに係るアプリケーションソフトウェア内に設定されたマスタであること、を特徴とする。 Furthermore, the information processing device according to the present invention is characterized in that the name identification data is a master set in application software related to ERP.
また、本発明に係る情報処理装置において、名寄せ元データは、OCR(Optical Character Recognition)により電子化された、または外部取込された電子データであること、を特徴とする。 Furthermore, the information processing apparatus according to the present invention is characterized in that the name identification data is electronic data digitized by OCR (Optical Character Recognition) or externally imported.
また、本発明に係る情報処理方法は、クレンジング手法と類似度計算手法との手法組み合わせが名寄せ先データの項目である先項目と紐付けて格納され、且つ、名寄せ元データの項目である元項目と先項目との項目組み合わせを1つまたは複数含む名寄せ実行時に使用する項目組み合わせ集合が名寄せ元データのテンプレートと紐付けて格納された記憶部にアクセス可能な、制御部を備える情報処理装置で実行される情報処理方法であって、前記制御部で実行される、名寄せ元データと名寄せ先データを受け取る受取ステップと、前記受け取った名寄せ元データのテンプレートに紐付く項目組み合わせ集合を、前記記憶部から取得し、取得した項目組み合わせ集合中の項目組み合わせごとに、当該項目組み合わせ中の先項目に紐付く手法組み合わせを、前記記憶部から取得する取得ステップと、1)前記取得した項目組み合わせ集合中の項目組み合わせと前記取得した手法組み合わせとの組み合わせごとに、11)前記受け取った名寄せ元データが保持する、当該項目組み合わせ中の元項目に係る値と、前記受け取った名寄せ先データが保持する、当該項目組み合わせ中の先項目に係る値と、に対する、当該手法組み合わせ中のクレンジング手法によるクレンジング処理と、12)クレンジング処理後の両値に対する、当該手法組み合わせ中の類似度計算手法による類似度計算処理と、を実行し、2)当該得られた各類似度を集計し、3)当該得られた集計値に基づく情報と、当該名寄せ先データが保持する、名寄せ先データを一意に識別するための先項目である識別先項目に係る値を、名寄せ結果として出力する名寄せ実行ステップと、を含むこと、を特徴とする。 Further, in the information processing method according to the present invention, a method combination of a cleansing method and a similarity calculation method is stored in association with a destination item that is an item of the name comparison destination data, and a source item that is an item of the name comparison source data is stored. Executed by an information processing device equipped with a control unit that can access a storage unit in which a set of item combinations used when performing name matching, including one or more item combinations of and destination item, is stored in association with the template of the name matching source data. The information processing method includes a receiving step of receiving the reference data and the reference data, which is executed by the control unit, and a set of item combinations linked to the template of the received reference data from the storage unit. an acquisition step of acquiring, for each item combination in the acquired item combination set, a method combination linked to a previous item in the item combination from the storage unit; 1) an item in the acquired item combination set; For each combination of a combination and the acquired method combination, 11) the value related to the source item in the item combination held by the received name reference data and the item combination held by the received name reference data; 12) A cleansing process using the cleansing method in the method combination for the value related to the previous item in 12) A similarity calculation process using the similarity calculation method in the method combination for both values after the cleansing process. 2) aggregate each of the obtained similarities, and 3) calculate information based on the obtained aggregate value and a previous item for uniquely identifying the reference data held by the reference data. It is characterized by including a name matching execution step of outputting a value related to a certain identification destination item as a name matching result.
また、本発明に係るプログラムは、クレンジング手法と類似度計算手法との手法組み合わせが名寄せ先データの項目である先項目と紐付けて格納され、且つ、名寄せ元データの項目である元項目と先項目との項目組み合わせを1つまたは複数含む名寄せ実行時に使用する項目組み合わせ集合が名寄せ元データのテンプレートと紐付けて格納された記憶部にアクセス可能な、制御部を備える情報処理装置に実行させるためのプログラムであって、前記制御部に実行させるための、名寄せ元データと名寄せ先データを受け取る受取ステップと、前記受け取った名寄せ元データのテンプレートに紐付く項目組み合わせ集合を、前記記憶部から取得し、取得した項目組み合わせ集合中の項目組み合わせごとに、当該項目組み合わせ中の先項目に紐付く手法組み合わせを、前記記憶部から取得する取得ステップと、1)前記取得した項目組み合わせ集合中の項目組み合わせと前記取得した手法組み合わせとの組み合わせごとに、11)前記受け取った名寄せ元データが保持する、当該項目組み合わせ中の元項目に係る値と、前記受け取った名寄せ先データが保持する、当該項目組み合わせ中の先項目に係る値と、に対する、当該手法組み合わせ中のクレンジング手法によるクレンジング処理と、12)クレンジング処理後の両値に対する、当該手法組み合わせ中の類似度計算手法による類似度計算処理と、を実行し、2)当該得られた各類似度を集計し、3)当該得られた集計値に基づく情報と、当該名寄せ先データが保持する、名寄せ先データを一意に識別するための先項目である識別先項目に係る値を、名寄せ結果として出力する名寄せ実行ステップと、を含むこと、を特徴とする。 Further, the program according to the present invention is such that a method combination of a cleansing method and a similarity calculation method is stored in association with a destination item that is an item of the name comparison destination data, and a source item that is an item of the name comparison source data and a destination item are stored. To cause the execution to be executed by an information processing device equipped with a control unit that can access a storage unit in which a set of item combinations used when performing name matching, including one or more item combinations with items, is stored in association with the template of the name matching source data. The program includes a receiving step for receiving the reference data and the reference data to be executed by the control unit, and a set of item combinations linked to the template of the received reference data from the storage unit. , an acquisition step of acquiring, for each item combination in the acquired item combination set, a method combination linked to a previous item in the item combination from the storage unit; 1) the item combination in the acquired item combination set; For each combination with the acquired method combination, 11) the value related to the source item in the item combination held by the received name reference data and the value of the source item in the item combination held by the received name reference data; 12) Perform a cleansing process using the cleansing method in the method combination for the value related to the previous item, and 12) Perform a similarity calculation process on both values after the cleansing process using the similarity calculation method in the method combination. , 2) aggregate each of the obtained similarities, and 3) information based on the obtained aggregate value and identification, which is the first item for uniquely identifying the reference data held by the reference data. The present invention is characterized by including a name matching execution step of outputting a value related to the previous item as a name matching result.
本発明は、多種多様な名寄せ場面(具体的には名寄せ元データ(例:帳票データ)と名寄せ先データ(例:マスタ)との組み合わせ)に応じた名寄せフローを、名寄せ場面ごとに設計・開発することなくコーディングレスで作成・実行することができる、という効果を奏する。 The present invention designs and develops name matching flows for each name matching situation, which correspond to a wide variety of name matching situations (specifically, combinations of name matching source data (e.g., form data) and name matching destination data (e.g., master)). This has the effect that it can be created and executed without any coding.
以下に、本発明に係る情報処理装置、情報処理方法およびプログラムの実施形態を、図面に基づいて詳細に説明する。なお、本実施形態により本発明が限定されるものではない。 Embodiments of an information processing device, an information processing method, and a program according to the present invention will be described in detail below based on the drawings. Note that the present invention is not limited to this embodiment.
[1.概要]
ここでは、本実施形態の概要について、図1から図7を参照して説明する。
[1. overview]
Here, an overview of this embodiment will be explained with reference to FIGS. 1 to 7.
従来は、名寄せする場面に応じた名寄せシステムが作成されていたが、ERPでは名寄せする場面が多岐にわたるため、場面ごとにシステムを毎回作成することは非効率であった。 In the past, name matching systems were created according to the situations in which names were to be linked, but since there are a wide variety of situations in which names should be linked in ERP, it was inefficient to create a system for each situation.
本実施形態では、各マスタの項目に対して最適な名寄せの処理工程を定義しておくことで、オペレータは、名寄せの内部処理を意識する必要がなくなり、項目のマッピングを行うだけで適切な名寄せが自動的に実装されるようになった。処理工程は、クレンジングと類似度計算で構成されており、各処理工程のクレンジング手法と類似度計算手法は、処理工程対象値の特徴に応じて選択することが可能である。これにより、開発コストが抑えられ、コーディングを行う必要なく適切な名寄せシステムを作成できる。 In this embodiment, by defining the optimal name matching processing process for each master item, the operator does not need to be aware of the internal processing of name matching, and can perform appropriate name matching just by mapping items. is now automatically implemented. The processing steps consist of cleansing and similarity calculation, and the cleansing method and similarity calculation method for each processing step can be selected depending on the characteristics of the processing step target value. This reduces development costs and allows you to create a suitable name identification system without the need for coding.
図1には、本実施形態で行われる名寄せ処理の流れが抽象化して示されている。本実施形態では、各名寄せ場面での名寄せ処理を抽象化し、処理の流れを定義した。これにより、名寄せ場面ごとでカスタマイズすべき部分を明らかにした。名寄せ処理では、まず、受け取った名寄せ元データと受け取ったマスタの項目マッピングを行い、つぎに、項目ごとにクレンジング処理と類似度計算を行い、最後に、類似度を集計してコード付与を行う。 FIG. 1 shows an abstracted flow of the name matching process performed in this embodiment. In this embodiment, the name matching process in each name matching scene is abstracted and the process flow is defined. This clarified the parts that should be customized for each name gathering situation. In the name matching process, first, item mapping is performed between the received name matching source data and the received master, then a cleansing process and similarity calculation are performed for each item, and finally, the similarities are aggregated and a code is assigned.
図2には、処理工程のまとまりおよび処理工程のマッピングの一例が示されている。クレンジングと類似度計算は、データ種類(例えば人名、住所など)ごとに異なるため、本実施形態では、これらをまとめて「処理工程」と命名し、データ種類ごとに処理工程を作成する。また、マスタの項目に適切な処理工程をマッピングすることで、マスタに応じた名寄せ処理をマッピング設定により実現可能となる。名寄せシステムにマスタの項目データを持たせるため、マスタと処理工程のマッピングの設定を名寄せシステムに記憶させることができる。これにより、当該マッピングの設定を名寄せ実行ごとに行う必要がなくなる。また、マスタへの処理工程のマッピングのみで名寄せ元データに対する処理工程も決定するため、名寄せ元データと処理工程のマッピングが必要なくなる。 FIG. 2 shows an example of a group of processing steps and a mapping of the processing steps. Since cleansing and similarity calculation differ depending on the data type (for example, person's name, address, etc.), in this embodiment, these are collectively named a "processing step" and a processing step is created for each data type. Furthermore, by mapping appropriate processing steps to items in the master, name matching processing according to the master can be realized by mapping settings. In order to have the master item data in the name matching system, the mapping settings between the master and the processing steps can be stored in the name matching system. This eliminates the need to configure the mapping each time name matching is performed. Further, since the processing steps for the comparison source data are determined only by mapping the processing steps to the master, there is no need to map the comparison source data and the processing steps.
図3には、クレンジングと類似度計算の部品化の一例が示されている。本実施形態では、部品化により、処理工程の処理変更を容易に行え、処理工程の追加、クレンジングや類似度計算の手法の追加、および処理工程のカスタマイズが効率よく可能となる。本実施形態では、使用場面に応じて、各処理工程に対し必要な部品(クレンジング手法と類似度計算手法)を選択することができる。 FIG. 3 shows an example of componentization of cleansing and similarity calculation. In this embodiment, the componentization makes it easy to change the processing steps, efficiently add processing steps, cleansing and similarity calculation methods, and customize the processing steps. In this embodiment, necessary parts (cleansing method and similarity calculation method) can be selected for each processing step depending on the usage situation.
図4には、コード付与辞書の処理が示されている。データによっては、場面に応じて特有の表記ゆれがあり、正しいコード付与ができないものが存在する。このようなデータに対して名寄せ処理を行うのは非効率である。そこで、本実施形態では、入力データの値(名寄せ元データの項目に係る値)と付与するコード(マスタの主キー項目に係る値)の組をレコードとしたコード付与辞書を用いた処理を行う。これにより、正しいコードが付与される。さらに、名寄せ処理を行わずにコード付与できるため、名寄せ処理を高速に行うことが可能となる。つまり、場面特有の表記ゆれを辞書に登録することで、正確かつ高速に名寄せを実行することができる。 FIG. 4 shows the processing of the code assignment dictionary. Depending on the data, there may be unique notation variations depending on the situation, and it may not be possible to assign the correct code. It is inefficient to perform name matching processing on such data. Therefore, in this embodiment, processing is performed using a code assignment dictionary in which the set of the input data value (value related to the item of the name identification source data) and the code to be assigned (value related to the master primary key item) is set as a record. . This will give you the correct code. Furthermore, since codes can be assigned without performing name matching processing, name matching processing can be performed at high speed. In other words, by registering scene-specific spelling variations in a dictionary, name matching can be performed accurately and quickly.
図5には、名寄せ元データに対する名寄せ結果および一致度の記号の一例が示されている。本実施形態では、名寄せ結果には、付与したコード、一致度、および、コードに応じた周辺情報を表示する。付与したコードの一致度は、図5に示す一致度の記号で表示する。このように、辞書によるコード付与の表示を変えることで、名寄せ結果の解釈性を向上させることができる。 FIG. 5 shows an example of the matching results and matching degree symbols for the matching source data. In this embodiment, the assigned code, degree of matching, and peripheral information corresponding to the code are displayed in the name matching result. The degree of coincidence of the assigned codes is displayed by the degree of coincidence symbol shown in FIG. In this way, by changing the display of codes assigned by the dictionary, it is possible to improve the interpretability of the name matching results.
図6には、類似度集計に導入する重み付け値の一例が示されている。名寄せでは、マスタや名寄せ元データの複数の項目を使用するが、名寄せにおける各項目の重要度は異なる。そこで、本実施形態では、重み付け値を導入し、類似度集計時に重み付け値を掛け合わせることで、各列(項目)の重要度を考慮したコード付与ができ、精度が向上する。 FIG. 6 shows an example of weighting values to be introduced into similarity aggregation. Name matching uses multiple items in the master and source data, but the importance of each item in name matching differs. Therefore, in this embodiment, by introducing a weighted value and multiplying it by the weighted value when calculating the similarity, it is possible to assign a code in consideration of the importance of each column (item), thereby improving accuracy.
図7には、修正ログの一例が示されている。本実施形態では、操作ログと修正ログの2種類のログが取得できる。特定の入力と修正後付与コードの組のログが複数回記録された場合、この組をコード付与辞書に登録するよう自動的に提案する。この提案に対し、辞書登録の可否をオペレータが判断できる。例えば、図7に示すように、入力が「OBIC、東京都中央区、SIer」であり、修正後付与コードが「A0002」という組のログが数回記録されている場合、「入力が『OBIC、東京都中央区、SIer』であった場合は『A0002』というコードを付与する」というルールを提案し、登録の可否をオペレータに判断させる。また、処理工程を作成する際に既存の処理工程との精度比較を行う場合、比較の基準として修正ログを用いる。修正ログにより、既存の処理工程では修正が必要であった入力に対して、新しい処理工程では正確にコード付与できるかを評価する。 FIG. 7 shows an example of a modification log. In this embodiment, two types of logs can be acquired: operation logs and modification logs. When a log of a set of a specific input and a corrected assigned code is recorded multiple times, it is automatically suggested that this set be registered in the code assigned dictionary. The operator can decide whether or not to register the proposal in the dictionary. For example, as shown in Figure 7, if the input is "OBIC, Chuo-ku, Tokyo, SIer" and the group with the corrected code "A0002" has been recorded several times, then , Chuo-ku, Tokyo, SIer', a code of 'A0002' will be assigned,' and the operator will decide whether registration is possible. Further, when creating a processing step and comparing accuracy with an existing processing step, a modification log is used as a reference for comparison. Using the modification log, evaluate whether the new processing process can accurately assign codes to inputs that required modification in the existing processing process.
本実施形態によれば、データの種類をまとめた処理工程を保持することで、幅広い使用場面に対して名寄せを行うことができる。また、データの種類毎の処理工程の設定をマッピングのみで行え、コストを抑えることができる。また、「データ種類ごとに適した処理工程を設定すること」、「使用場面ごとに処理工程の部品を取り換えられること」および「表記ゆれをコード付与辞書で対応すること」により、精度を保った名寄せを行うことができる。また、「コード付与辞書による結果の表示を変えること」により、修正作業の補助として結果を役立てることができる。これらにより、人の手による修正作業を効率よく行うことができる。 According to this embodiment, by retaining processing steps that summarize data types, name matching can be performed for a wide range of usage situations. Furthermore, the processing steps for each type of data can be set simply by mapping, which can reduce costs. In addition, accuracy was maintained by ``setting the appropriate processing process for each data type,'' ``being able to replace parts of the processing process depending on the usage situation,'' and ``corresponding to variations in notation using a code assignment dictionary.'' Name identification can be performed. Furthermore, by ``changing the display of the results using the code assignment dictionary'', the results can be used to assist in correction work. These allow manual correction work to be performed efficiently.
[2.構成・処理]
ここでは、本実施形態に係る情報処理装置の構成と処理の一例について、図8から図30を参照して説明する。
[2. Configuration/Processing]
Here, an example of the configuration and processing of the information processing apparatus according to this embodiment will be described with reference to FIGS. 8 to 30.
図8は、情報処理装置(名寄せ処理装置)100の構成の一例を示すブロック図である。情報処理装置100は、市販のデスクトップ型パーソナルコンピュータである。なお、情報処理装置100は、デスクトップ型パーソナルコンピュータのような据置型情報処理装置に限らず、市販されているノート型パーソナルコンピュータ、PDA(Personal Digital Assistants)、スマートフォン、タブレット型パーソナルコンピュータなどの携帯型情報処理装置であってもよい。
FIG. 8 is a block diagram showing an example of the configuration of the information processing device (name matching processing device) 100.
情報処理装置100は、制御部102と通信インターフェース部104と記憶部106と入出力インターフェース部108と、を備えている。情報処理装置100が備えている各部は、任意の通信路を介して通信可能に接続されている。
The
通信インターフェース部104は、ルータ等の通信装置および専用線等の有線または無線の通信回線を介して、情報処理装置100をネットワーク300に通信可能に接続する。通信インターフェース部104は、他の装置と通信回線を介してデータを通信する機能を有する。ここで、ネットワーク300は、情報処理装置100とERPシステム200(ERPに係るアプリケーションソフトウェアが導入された情報処理装置)とを相互に通信可能に接続する機能を有し、例えばインターネットやLAN(Local Area Network)等である。なお、情報処理装置100は、ERPに係るアプリケーションソフトウェアが導入されたものであってもよい。
The
入出力インターフェース部108には、入力装置112および出力装置114が接続されている。出力装置114には、モニタ(家庭用テレビを含む)の他、スピーカやプリンタを用いることができる。入力装置112には、キーボード、マウス、及びマイクの他、マウスと協働してポインティングデバイス機能を実現するモニタを用いることができる。なお、以下では、出力装置114をモニタ114とし、入力装置112をキーボード112またはマウス112として記載する場合がある。
An
記憶部106には、各種のデータベース、テーブルおよびファイルなどが格納される。記憶部106には、OS(Operating System)と協働してCPU(Central Processing Unit)に命令を与えて各種処理を行うためのコンピュータプログラムが記録される。記憶部106として、例えば、RAM(Random Access Memory)・ROM(Read Only Memory)等のメモリ装置、ハードディスクのような固定ディスク装置、フレキシブルディスク、および光ディスク等を用いることができる。
The
[2-1.記憶部106の構成の概要]
ここでは、記憶部106の構成の概要について、説明する。記憶部106には、大まかに、クレンジング手法と類似度計算手法との手法組み合わせが、名寄せ先データの項目である先項目と紐付けて格納され、且つ、名寄せ元データの項目である元項目と先項目との項目組み合わせを1つまたは複数含む名寄せ実行時に使用する項目組み合わせ集合が、名寄せ元データのテンプレートと紐付けて格納されている。
[2-1. Overview of configuration of storage unit 106]
Here, an overview of the configuration of the
ここで、記憶部106は、以下の[11]から[15]のデータが格納されたものでもよい。なお、記憶部106には、重み付け値が先項目と紐付けてさらに格納されてもよい。また、記憶部106には、以下の[16]のデータがさらに格納されてもよい。
[11]手法組み合わせを複数含む手法組み合わせ集合
[12]先項目と手法組み合わせの識別情報との先項目・手法組み合わせを、名寄せ先データ中の先項目の個数分含む先項目・手法組み合わせ集合を、名寄せ先データ別に複数含む先項目・手法組み合わせ集合族
[13]項目組み合わせ集合を1つまたは複数含む項目組み合わせ集合族
[14]項目組み合わせ集合の識別情報と先項目・手法組み合わせ集合の識別情報との組み合わせを1つまたは複数含む第一組み合わせ集合を1つまたは複数含む第一組み合わせ集合族
[15]第一組み合わせ集合の識別情報と名寄せ元データのテンプレートの識別情報との組み合わせを1つまたは複数含む第二組み合わせ集合
[16]名寄せ元データが保持する、項目組み合わせ集合中の元項目に係る値と、名寄せ先データが保持する、名寄せ先データを一意に識別するための先項目である識別先項目(例:主キー項目)に係る値と、を紐付けて登録した辞書データ
Here, the
[11] Method combination set that includes multiple method combinations [12] A destination item/method combination set that includes the number of destination item/method combinations of the destination item and identification information of the method combination, as many as the number of destination items in the destination data, [13] Item combination set family that includes one or more item combination sets [14] Identification information of the item combination set and identification information of the previous item/method combination set A first combination set family that includes one or more first combination sets that include one or more combinations [15] Contains one or more combinations of the identification information of the first combination set and the identification information of the template of the name source data Second combination set [16] The value related to the source item in the item combination set held by the name source data and the identification destination item that is the first item for uniquely identifying the name source data and held by the name source data. Dictionary data registered by linking values related to (e.g. primary key items) and
ここで、名寄せ元データは、例えば、発注書データ、見積書データ、その他の帳票データ(例えばOCRにより電子化された、または外部取込された(例えばEDIによりデータベースへ取り込まれた)電子データなど)である。名寄せ先データは、例えば、得意先マスタ、商品マスタ、その他のERPシステム200内に設定されたマスタである。 Here, the source data includes, for example, purchase order data, quotation data, other form data (for example, electronic data digitized by OCR or externally imported (for example, imported into a database by EDI)), etc. ). The name identification data is, for example, a customer master, a product master, or another master set in the ERP system 200.
[2-2.記憶部106の構成の具体例]
ここでは、記憶部106の構成の具体例について、図9から図26を参照して説明する。具体的には、記憶部106は、以下のデータおよびマスタが格納されたものである。
・処理工程データ106a
・クレンジング適用データ106b
・クレンジング手法マスタ106c
・類似度計算手法マスタ106d
・マスタ-処理工程マッピングデータ106e
・マスタ-処理工程マッピング明細データ106f
・マスタ一覧マスタ106g
・マスタ項目マスタ106h
・名寄せ手法データ106i
・コード付与設定データ106j
・列マッピングデータ106k
・データテンプレートマスタ106m
・データテンプレート項目マスタ106n
・コード付与辞書条件データ106p
・コード付与辞書付与データ106q
・操作ログデータ106r
・修正ログヘッダデータ106s
・修正ログ明細データ106t
[2-2. Specific example of configuration of storage unit 106]
Here, a specific example of the configuration of the
・
・Cleansing
・
・Similarity
・Master processing
・Master processing process
・
・
・Name
・Code
・
・
・Data
・Code assignment
・Code assignment
・
・Correction
・Correction
図9は、処理工程データ106aの一例を示す図である。処理工程データ106aは、処理工程識別情報(手法組み合わせの識別情報に相当)、類似度計算手法識別情報(手法組み合わせ中の類似度計算手法の識別情報に相当)およびデータ生成日付を含む。
FIG. 9 is a diagram showing an example of the
図10は、クレンジング適用データ106bの一例を示す図である。クレンジング適用データ106bは、処理工程識別情報(手法組み合わせの識別情報に相当)、実行順、クレンジング手法識別情報(手法組み合わせ中のクレンジング手法の識別情報に相当)、辞書データへのパスおよびデータ生成日付を含む。
FIG. 10 is a diagram showing an example of cleansing
図11は、クレンジング手法マスタ106cの一例を示す図である。クレンジング手法マスタ106cは、クレンジング手法識別情報(クレンジング手法の識別情報に相当)および辞書フラグを含む。
FIG. 11 is a diagram showing an example of the
図12は、類似度計算手法マスタ106dの一例を示す図である。類似度計算手法マスタ106dは、類似度計算手法識別情報(類似度計算手法の識別情報に相当)およびオプションフラグを含む。
FIG. 12 is a diagram showing an example of the similarity
図13は、マスタ-処理工程マッピングデータ106eの一例を示す図である。マスタ-処理工程マッピングデータ106eは、マスタ処理工程マッピング識別情報(先項目・手法組み合わせ集合の識別情報に相当)、マスタ識別情報(名寄せ先データの識別情報に相当)およびデータ生成日付を含む。
FIG. 13 is a diagram showing an example of the master-processing
図14は、マスタ-処理工程マッピング明細データ106fの一例を示す図である。マスタ-処理工程マッピング明細データ106fは、先項目・手法組み合わせ集合族に相当する。マスタ-処理工程マッピング明細データ106fは、マスタ処理工程マッピング識別情報(先項目・手法組み合わせ集合の識別情報に相当)、マスタ項目識別情報(先項目・手法組み合わせ中の先項目の識別情報に相当)、処理工程識別情報(先項目・手法組み合わせ中の手法組み合わせの識別情報に相当)、重み付け値およびデータ生成日付を含む。
FIG. 14 is a diagram showing an example of master-processing process
図15は、マスタ一覧マスタ106gの一例を示す図である。マスタ一覧マスタ106gは、マスタ識別情報(名寄せ先データの識別情報に相当)を含む。
FIG. 15 is a diagram showing an example of the
図16は、マスタ項目マスタ106hの一例を示す図である。マスタ項目マスタ106hは、マスタ項目識別情報(先項目の識別情報に相当)、マスタ識別情報(名寄せ先データの識別情報に相当)および主キー設定情報を含む。
FIG. 16 is a diagram showing an example of the
図17は、名寄せ手法データ106iの一例を示す図である。名寄せ手法データ106iは、第二組み合わせ集合に相当する。名寄せ手法データ106iは、名寄せ手法識別情報(第一組み合わせ集合の識別情報に相当)、データテンプレート識別情報(名寄せ元データのテンプレートの識別情報に相当)およびデータ生成日付を含む。
FIG. 17 is a diagram showing an example of the name matching
図18は、コード付与設定データ106jの一例を示す図である。コード付与設定データ106jは、第一組み合わせ集合族に相当する。コード付与設定データ106jは、名寄せ手法データ識別情報(項目組み合わせ集合の識別情報に相当)、名寄せ手法識別情報(第一組み合わせ集合の識別情報に相当)、マスタ処理工程マッピング識別情報(先項目・手法組み合わせ集合の識別情報に相当)およびデータ生成日付を含む。
FIG. 18 is a diagram showing an example of the code
図19は、列マッピングデータ106kの一例を示す図である。列マッピングデータ106kは、項目組み合わせ集合族に相当する。名寄せ手法データ識別情報(項目組み合わせ集合の識別情報に相当)、マスタ項目識別情報(項目組み合わせ中の先項目の識別情報に相当)およびデータ項目識別情報(項目組み合わせ中の元項目の識別情報に相当)を含む。
FIG. 19 is a diagram showing an example of
図20は、データテンプレートマスタ106mの一例を示す図である。データテンプレートマスタ106mは、データテンプレート識別情報(名寄せ元データのテンプレートの識別情報に相当)を含む。
FIG. 20 is a diagram showing an example of the
図21は、データテンプレート項目マスタ106nの一例を示す図である。データテンプレート項目マスタ106nは、データ項目識別情報(元項目の識別情報に相当)およびデータテンプレート識別情報(名寄せ元データのテンプレートの識別情報に相当)を含む。
FIG. 21 is a diagram showing an example of the data
図22は、コード付与辞書条件データ106pの一例を示す図である。コード付与辞書条件データ106pは、コード付与辞書レコード識別情報、データ項目識別情報および当該データ項目識別情報で特定される項目に係るコード値を含む。
FIG. 22 is a diagram showing an example of the code assignment
図23は、コード付与辞書付与データ106qの一例を示す図である。コード付与辞書付与データ106qは、コード付与辞書レコード識別情報、マスタ識別情報および当該マスタ識別情報で特定されるマスタが保持する主キー項目に係るコード値を含む。
FIG. 23 is a diagram showing an example of code assignment
図24は、操作ログデータ106rの一例を示す図である。操作ログデータ106rは、操作ログ識別情報、データ名識別情報、名寄せ手法識別情報(第一組み合わせ集合の識別情報に相当)およびデータ生成日付を含む。
FIG. 24 is a diagram showing an example of the
図25は、修正ログヘッダデータ106sの一例を示す図である。修正ログヘッダデータ106sは、修正ログ識別情報、操作ログ識別情報、名寄せ手法データ識別情報(項目組み合わせ集合の識別情報に相当)、修正前コード値、修正後コード値およびデータ生成日付を含む。
FIG. 25 is a diagram showing an example of the modified
図26は、修正ログ明細データ106tの一例を示す図である。修正ログ明細データ106tは、修正ログ識別情報、データ項目識別情報(項目組み合わせ中の元項目の識別情報に相当)、当該データ項目識別情報で特定される項目に係るコード値およびデータ生成日付を含む。
FIG. 26 is a diagram showing an example of modification
以上で、記憶部106の構成の具体例についての説明を終了する。
This concludes the description of the specific example of the configuration of the
図8に戻り、制御部102は、情報処理装置100を統括的に制御するCPU等である。制御部102は、OS等の制御プログラム・各種の処理手順等を規定したプログラム・所要データなどを格納するための内部メモリを有し、格納されているこれらのプログラムに基づいて種々の情報処理を実行する。
Returning to FIG. 8, the
制御部102は、機能概念的に、第一設定部102a、第二設定部102b、第三設定部102c、受取部102d、取得部102e、辞書使用名寄せ実行部102f、名寄せ実行部102gおよび提案情報出力部102hなどを備える。
Functionally, the
[2-3.制御部102が備える各処理部が実行する処理の概要]
ここでは、制御部102が備える各処理部が実行する処理の概要について、説明する。
[2-3. Overview of processing executed by each processing unit included in the control unit 102]
Here, an overview of the processing executed by each processing unit included in the
第一設定部102aは、第一の設定画面を介して、オペレータに、手法組み合わせを設定させる。第一の設定画面は、クレンジング手法を設定させるための領域と、類似度計算手法を設定させるための領域とを含む。
The
第二設定部102bは、第二の設定画面を介して、オペレータに、先項目・手法組み合わせ集合を設定させる。第二の設定画面は、名寄せ先データを設定させるための領域と、設定された名寄せ先データ中の先項目を表示させるための領域と、先項目に適用する手法組み合わせを設定させるための領域と、を含む。
The
第三設定部102cは、第三の設定画面を介して、オペレータに、項目組み合わせ集合、名寄せ元データのテンプレートおよび先項目・手法組み合わせ集合の紐付けを設定させる。第三の設定画面は、名寄せ元データのテンプレートを設定させるための領域と、名寄せ先データを設定させるための領域と、先項目・手法組み合わせ集合を設定させるための領域と、設定された名寄せ先データ中の先項目と設定されたテンプレート中の元項目とを表示させ、項目組み合わせ集合を設定させるための領域と、を含む。
The
受取部102dは、名寄せ元データと名寄せ先データを受け取る。受取部102dは、ERPシステム200から転送された名寄せ元データと名寄せ先データを受け取ってもよい。
The receiving
取得部102eは、受取部102dで受け取った名寄せ元データのテンプレートに紐付く項目組み合わせ集合を、記憶部106から取得し、取得した項目組み合わせ集合中の項目組み合わせごとに、当該項目組み合わせ中の先項目に紐付く手法組み合わせを、記憶部106から取得する。
The
取得部102eは、取得した項目組み合わせ集合中の項目組み合わせごとに、当該項目組み合わせ中の先項目に紐付く重み付け値を、記憶部106からさらに取得してもよい。
The
取得部102eは、以下の[21]から[24]の処理を実行してもよい。
[21]受取部102dで受け取った名寄せ元データ中のテンプレートの識別情報に紐付く第一組み合わせ集合の識別情報を、第二組み合わせ集合から取得する。
[22][21]で取得した第一組み合わせ集合の識別情報で特定される第一組み合わせ集合を、第一組み合わせ集合族から取得する。
[23][22]で取得した第一組み合わせ集合中の項目組み合わせ集合の識別情報で特定される項目組み合わせ集合を、項目組み合わせ集合族から取得するとともに、当該取得した第一組み合わせ集合中の先項目・手法組み合わせ集合の識別情報で特定される先項目・手法組み合わせ集合を、先項目・手法組み合わせ集合族から取得する。
[24][23]で取得した先項目・手法組み合わせ集合から、[23]で取得した項目組み合わせ集合中の先項目に紐付く手法組み合わせを取得する。
The
[21] Obtain the identification information of the first combination set linked to the identification information of the template in the matching source data received by the receiving
[22] A first combination set specified by the identification information of the first combination set obtained in [21] is obtained from the first combination set family.
[23] Obtain the item combination set specified by the identification information of the item combination set in the first combination set obtained in [22] from the item combination set family, and also obtain the previous item in the obtained first combination set. - Obtain the previous item/method combination set specified by the identification information of the method combination set from the previous item/method combination set family.
[24] From the previous item/method combination set obtained in [23], obtain the method combination that is linked to the previous item in the item combination set obtained in [23].
辞書使用名寄せ実行部102fは、「受取部102dで受け取った名寄せ元データが保持する、取得部102eが取得した項目組み合わせ集合(具体的には[23]で取得した項目組み合わせ集合)中の元項目に係る値」が、辞書データに登録されたものと同じである場合に、辞書データに登録された識別先項目(例:主キー項目)に係る値と、当該値が辞書データに登録されたものであることを示す情報(例:「辞」という文字情報)を、名寄せ結果として、例えば名寄せ元データと名寄せ先データの転送元のERPシステム200を出力先として出力する。
The dictionary-using name matching
名寄せ実行部102gは、以下の[31]から[33]の処理を実行する。
[31]「取得部102eが取得した項目組み合わせ集合(具体的には[23]で取得した項目組み合わせ集合)中の項目組み合わせ」と「取得部102eが取得した手法組み合わせ(具体的には[24]で取得した手法組み合わせ)」との組み合わせごとに、以下の[311]の処理と[312]の処理を実行する。
[311]「受取部102dで受け取った名寄せ元データが保持する、当該項目組み合わせ中の元項目に係る値」と「受取部102dで受け取った名寄せ先データが保持する、当該項目組み合わせ中の先項目に係る値」とに対する、当該手法組み合わせ中のクレンジング手法によるクレンジング処理
[312]クレンジング処理後の両値に対する、当該手法組み合わせ中の類似度計算手法による類似度計算処理
[32][31]で得られた各類似度を集計する。
[33][32]で得られた集計値に基づく情報と、当該名寄せ先データが保持する、識別先項目(例:主キー項目)に係る値を、名寄せ結果として、例えば名寄せ元データと名寄せ先データの転送元のERPシステム200を出力先として出力する。
The name
[31] “Item combinations in the item combination set acquired by the
[311] “The value related to the source item in the item combination that is held by the matching source data received by the receiving
[33] The information based on the aggregate value obtained in [32] and the value related to the identification item (e.g. primary key item) held by the target data are merged with, for example, the source data as the merge result. The ERP system 200 from which the destination data is transferred is output as the output destination.
名寄せ実行部102gは、各類似度に取得した各重み付け値を掛け合わせて各類似度を集計してもよい。
The name
名寄せ実行部102gは、集計値と1つの閾値または互いに異なる複数の閾値との大小を比較し、比較結果に応じたコンテンツ(例:名寄せの精度が高いことを意味する記号(例:○)、名寄せの精度が中程度であることを意味する記号(例:△)、名寄せの精度が低いことを意味する記号(例:×))を、集計値に基づく情報として出力してもよい。
The name
名寄せ実行部102gは、「受取部102dで受け取った名寄せ先データが保持する、取得部102eで取得した項目組み合わせ集合(具体的には[23]で取得した項目組み合わせ集合)中の先項目に係る値」を、名寄せ結果としてさらに出力してもよい。
The name
名寄せ実行部102gは、「受取部102dで受け取った名寄せ元データが保持する、取得部102eで取得した項目組み合わせ集合(具体的には[23]で取得した項目組み合わせ集合)中の元項目に係る値」が、辞書データに登録されたものと同じでなかった場合に、[31]から[33]の処理を実行してもよい。
The name
提案情報出力部102hは、「受取部102dで受け取った名寄せ元データが保持する、取得部102eで取得した項目組み合わせ集合(具体的には[23]で取得した項目組み合わせ集合)中の元項目に係る値」と「受取部102dで受け取った名寄せ先データが保持する識別先項目(例:主キー項目)に係る値」とに関する特定の組み合わせが、名寄せ実行部102gにおいて所定回数以上記録された場合、当該特定の組み合わせの辞書データへの登録を提案するための提案情報(例えば、当該提案に関するテキスト情報)を、例えば名寄せ元データと名寄せ先データの転送元のERPシステム200を出力先として出力する。
The proposal
以上で、制御部102が備える各処理部が実行する処理の概要についての説明を終了する。
This concludes the explanation of the outline of the processing executed by each processing unit included in the
[2-4.制御部102が備える各処理部が実行する処理の具体例]
ここでは、制御部102が備える各処理部が実行する処理の具体例について、図27から図30等を参照して説明する。
[2-4. Specific example of processing executed by each processing unit included in the control unit 102]
Here, specific examples of processing executed by each processing unit included in the
第一設定部102aは、処理工程設定画面MAを介して、オペレータに、登録する処理工程の基となるクレンジング手法と類似度計算手法を設定させる。
The
図27は、処理工程設定画面MAの一例を示す図である。処理工程設定画面MAは、登録ボタンMA1、取消ボタンMA2、戻るボタンMA3、設定領域MA4、設定領域MA5および設定領域MA6を含む。 FIG. 27 is a diagram showing an example of the processing step setting screen MA. The processing step setting screen MA includes a registration button MA1, a cancel button MA2, a back button MA3, a setting area MA4, a setting area MA5, and a setting area MA6.
設定領域MA4は、登録する処理工程の処理工程識別情報を設定させるための領域である。設定領域MA5は、登録する処理工程の基となるクレンジング手法のクレンジング手法識別情報を設定させるための領域である。設定領域MA6は、登録する処理工程の基となる類似度計算手法の類似度計算手法識別情報を設定させるための領域である。 Setting area MA4 is an area for setting processing process identification information of a processing process to be registered. The setting area MA5 is an area for setting cleansing method identification information of the cleansing method that is the basis of the processing step to be registered. The setting area MA6 is an area for setting similarity calculation method identification information of the similarity calculation method that is the basis of the processing step to be registered.
オペレータは、設定領域MA4に、登録する処理工程を設定し、設定領域MA5と設定領域MA6に、その処理工程の基となるクレンジング手法と類似度計算手法を設定する。オペレータは、+ボタンを押下して、クレンジング手法を複数設定してもよい。設定できるクレンジング手法と類似度計算手法は、図11のクレンジング手法マスタ106cと図12の類似度計算手法マスタ106d内の手法である。登録ボタンMA1を押すと、処理工程設定画面MAの情報が、図9の処理工程データ106aと図10のクレンジング適用データ106bに登録される。図9と図10に示す情報は、名寄せ処理の実行前に登録しておく。
The operator sets the processing step to be registered in the setting area MA4, and sets the cleansing method and similarity calculation method that are the basis of the processing step in the setting area MA5 and setting area MA6. The operator may press the + button to set multiple cleansing methods. The cleansing methods and similarity calculation methods that can be set are those in the
図8に戻り、第二設定部102bは、マスタ-処理工程マッピング設定画面MBを介して、オペレータに、登録するマスタ処理工程マッピングの基となるマスタとマスタ項目と処理工程と重み付け値を設定させる。
Returning to FIG. 8, the
図28は、マスタ-処理工程マッピング設定画面MBの一例を示す図である。マスタ-処理工程マッピング設定画面MBは、登録ボタンMB1、取消ボタンMB2、戻るボタンMB3、設定領域MB4、設定領域MB5および設定領域MB6を含む。 FIG. 28 is a diagram showing an example of the master-processing process mapping setting screen MB. The master-processing process mapping setting screen MB includes a registration button MB1, a cancel button MB2, a back button MB3, a setting area MB4, a setting area MB5, and a setting area MB6.
設定領域MB4は、登録するマスタ処理工程マッピングの基となるマスタのマスタ識別情報を設定させるための領域である。設定領域MB5は、登録するマスタ処理工程マッピングのマスタ処理工程マッピング識別情報を設定させるための領域である。設定領域MB6は、設定領域MB4に設定されたマスタ識別情報で特定されるマスタ中のマスタ項目のマスタ項目識別情報を表示させ、マスタ項目に適用する処理工程の処理工程識別情報と重み付け値を設定させるための領域である。 The setting area MB4 is an area for setting master identification information of a master that is the basis of the master processing step mapping to be registered. The setting area MB5 is an area for setting master processing process mapping identification information of the master processing process mapping to be registered. The setting area MB6 displays the master item identification information of the master item in the master specified by the master identification information set in the setting area MB4, and sets the process process identification information and weighting value of the process process applied to the master item. This is an area for
オペレータは、設定領域MB5に、登録するマスタ処理工程マッピングを設定し、設定領域MB4に、登録するマスタ処理工程マッピングの基となるマスタを設定する。設定できるマスタは、図15のマスタ一覧マスタ106g内のマスタである。設定領域MB4にマスタが設定されると、図16のマスタ項目マスタ106h内にある、当該設定されたマスタに紐付くマスタ項目が、設定領域MB6に表示される。オペレータは、設定領域MB6に、表示されたマスタ項目に適用する処理工程と重み付け値を設定する。登録ボタンMB1を押すと、マスタ-処理工程マッピング設定画面MBの情報が、図13のマスタ-処理工程マッピングデータ106eと図14のマスタ-処理工程マッピング明細データ106fに登録される。図13と図14に示す情報は、名寄せ処理の実行前に登録しておく。
The operator sets the master processing step mapping to be registered in the setting area MB5, and sets the master on which the master processing step mapping to be registered is based in the setting area MB4. The masters that can be set are the masters in the
図8に戻り、第三設定部102cは、名寄せ手法設定画面MCを介して、オペレータに、登録する名寄せ手法の基となるデータテンプレートと名寄せ手法データとマスタ処理工程マッピングとマスタ項目とデータ項目を設定させる。
Returning to FIG. 8, the
図29は、名寄せ手法設定画面MCの一例を示す図である。名寄せ手法設定画面MCは、登録ボタンMC1、取消ボタンMC2、戻るボタンMC3、設定領域MC4、設定領域MC5、設定領域MC6、設定領域MC7および設定領域MC8を含む。 FIG. 29 is a diagram showing an example of the name matching method setting screen MC. The name identification method setting screen MC includes a registration button MC1, a cancel button MC2, a return button MC3, a setting area MC4, a setting area MC5, a setting area MC6, a setting area MC7, and a setting area MC8.
設定領域MC4は、登録する名寄せ手法の名寄せ手法識別情報を設定させるための領域である。設定領域MC5は、登録する名寄せ手法の基となるデータテンプレートのデータテンプレート識別情報を設定させるための領域である。設定領域MC6は、マスタを設定させるための領域である。設定領域MC7は、登録する名寄せ手法の基となるマスタ処理工程マッピングのマスタ処理工程マッピング識別情報を設定させるための領域である。設定領域MC8は、設定領域MC6に設定されたマスタ識別情報で特定されるマスタ中のマスタ項目のマスタ項目識別情報と、設定領域MC5に設定されたデータテンプレート識別情報で特定されるデータテンプレートに紐付くデータ項目のデータ項目識別情報を表示させ、1つのコード付与を行うための名寄せ手法データを設定させるための領域である。 The setting area MC4 is an area for setting the name matching method identification information of the name matching method to be registered. The setting area MC5 is an area for setting data template identification information of a data template that is the basis of the name matching method to be registered. The setting area MC6 is an area for setting a master. The setting area MC7 is an area for setting master processing process mapping identification information of a master processing process mapping that is the basis of the name matching method to be registered. The setting area MC8 is linked to the master item identification information of the master item in the master specified by the master identification information set in the setting area MC6 and the data template specified by the data template identification information set in the setting area MC5. This area is for displaying the data item identification information of the attached data item and for setting name matching method data for assigning one code.
オペレータは、設定領域MC4に、登録する名寄せ手法を設定し、設定領域MC5に、登録する名寄せ手法の基となるデータテンプレートを設定する。設定できるデータテンプレートは、図20のデータテンプレートマスタ106m内のテンプレートである。設定領域MC5にデータテンプレートが設定されると、図21のデータテンプレート項目マスタ106n内にある、設定されたデータテンプレートに紐付くデータ項目が、設定領域MC8の「名寄せ元データ項目」と題した領域に表示される。オペレータは、設定領域MC6に、1つのコード付与に使用されるマスタを設定する。設定できるマスタは、図15のマスタ一覧マスタ106g内のマスタである。設定領域MC6にマスタが設定されると、図16のマスタ項目マスタ106h内にある、設定されたマスタに紐付くマスタ項目が、設定領域MC8の「マスタの列」と題した領域に表示される。オペレータは、選択領域MC7に、登録する名寄せ手法の基となるマスタ処理工程マッピングを設定する。オペレータは、設定領域MC8に表示されたデータ項目とマスタ項目のうち、1つのコード付与時に使用するデータ項目とマスタ項目の組み合わせを、図28に示すように線等で設定する。登録ボタンMC1を押すと、名寄せ手法設定画面MCの情報が、図17の名寄せ手法データ106i、図18のコード付与設定データ106jおよび図19の列マッピングデータ106kに登録される。図17、図18および図19に示す情報は、名寄せ処理の実行前に登録しておく。
The operator sets the name matching method to be registered in the setting area MC4, and sets the data template that is the basis of the name matching method to be registered in the setting area MC5. The data templates that can be set are the templates in the
図8に戻り、受取部102dは、ERPシステム200から転送された帳票データ(テーブル)(名寄せ元データの一例)とマスタ(テーブル)(名寄せ先データの一例)を受け取る。
Returning to FIG. 8, the receiving
取得部102eは、以下の[41]から[46]の処理を実行する。
[41]名寄せ手法データ106iから、受取部102dで受け取った帳票データに付与されている当該帳票データのテンプレート識別情報に紐付く名寄せ手法識別情報を取得する。
[42]コード付与設定データ106jから、[41]で取得した名寄せ手法識別情報に紐付く1つまたは複数の「名寄せ手法データ識別情報とマスタ処理工程マッピング識別情報の組み合わせ」を取得する。
[43][42]で取得した名寄せ手法データ識別情報ごとに、列マッピングデータ106kから、名寄せ手法データ識別情報に紐付く1つまたは複数の「マスタ項目識別情報とデータ項目識別情報の組み合わせ」を取得する。
[44][42]で取得したマスタ処理工程マッピング識別情報ごとに、マスタ-処理工程マッピングデータ106eおよびマスタ-処理工程マッピング明細データ106fから、マスタ処理工程マッピング識別情報に紐付くマスタ識別情報と複数の「マスタ項目識別情報と処理工程識別情報と重み付け値の組み合わせ」を取得する。
[45][43]で取得したマスタ項目識別情報ごとに、[44]で取得した複数の「マスタ項目識別情報と処理工程識別情報と重み付け値の組み合わせ」から、マスタ項目識別情報に紐付く処理工程識別情報と重み付け値を取得する。
[46][45]で取得した処理工程識別情報ごとに、処理工程データ106aおよびクレンジング適用データ106bから、処理工程識別情報に紐付く「1つまたは複数のクレンジング手法識別情報と1つまたは複数の類似度計算手法識別情報の組み合わせ」を取得する。
The
[41] From the name matching
[42] One or more "combinations of name matching method data identification information and master processing step mapping identification information" that are linked to the name matching method identification information obtained in [41] are acquired from the code
[43] For each name matching method data identification information obtained in [42], one or more "combinations of master item identification information and data item identification information" linked to the name matching method data identification information are extracted from the
[44] For each master processing process mapping identification information acquired in [42], from the master processing
[45] For each master item identification information obtained in [43], a process of linking it to the master item identification information from the multiple "combinations of master item identification information, processing process identification information, and weighting values" obtained in [44]. Obtain process identification information and weighting values.
[46] For each processing step identification information acquired in [45], from the
辞書使用名寄せ実行部102fは、i)コード付与辞書レコード識別情報を基に、コード付与辞書条件データ106pから、一致判断の条件となるデータ項目識別情報およびコード値を取得すると共に、コード付与辞書付与データ106qから、付与するコード値を取得し、ii)取得部102eが[43]で取得した各データ項目識別情報および、受取部102dで受け取った帳票データが保持する、当該各データ項目識別情報で特定される各項目に係る各値とが、i)で取得したデータ項目識別情報およびコード値と全て一致するか判断する。
The dictionary use name matching
辞書使用名寄せ実行部102fは、一致すると判断した場合、i)で取得した付与するコード値と、当該値が辞書データに登録されたものであることを示す情報(例:「辞」という文字情報)を、名寄せ結果として、例えば帳票データとマスタの転送元のERPシステム200を出力先として出力する。
When the dictionary use name matching
名寄せ実行部102gは、例えば辞書使用名寄せ実行部102fが一致すると判断しなかった場合、以下の[51]から[53]の処理を実行する。
[51]取得部102eが[43]で取得した「マスタ項目識別情報とデータ項目識別情報の組み合わせ」と、取得部102eが[46]で取得した「1つまたは複数のクレンジング手法識別情報と1つまたは複数の類似度計算手法識別情報の組み合わせ」との組み合わせごとに、以下の[511]のクレンジング処理と、以下の[512]の類似度計算処理を実行する。
[511]「受取部102dで受け取った帳票データが保持する、当該『マスタ項目識別情報とデータ項目識別情報の組み合わせ』中のデータ項目識別情報で特定される項目に係る値」と「受取部102dで受け取ったマスタが保持する、当該『マスタ項目識別情報とデータ項目識別情報の組み合わせ』中のマスタ項目識別情報で特定される項目に係る値」とに対する、当該「1つまたは複数のクレンジング手法識別情報と1つまたは複数の類似度計算手法識別情報の組み合わせ」中のクレンジング手法識別情報で特定されるクレンジング手法によるクレンジング処理
[512]クレンジング処理後の両値に対する、当該「1つまたは複数のクレンジング手法識別情報と1つまたは複数の類似度計算手法識別情報の組み合わせ」中の類似度計算手法識別情報で特定される類似度計算手法による類似度計算処理
[52][51]で得られた各類似度に、取得部102eが[45]で取得した各重み付け値を掛け合わせて、当該各類似度を集計する。
[53][52]で得られた集計値と1つの閾値または互いに異なる複数の閾値との大小を比較し、以下の情報を、名寄せ結果として、例えば帳票データテーブルとマスタテーブルの転送元のERPシステム200を出力先として出力する。
・比較結果に応じたコンテンツ(例:名寄せの精度が高いことを意味する記号(例:○)、名寄せの精度が中程度であることを意味する記号(例:△)、名寄せの精度が低いことを意味する記号(例:×))
・受取部102dで受け取ったマスタの主キー項目と、当該主キー項目に係る値(コード)
・取得部102eが[43]で取得した「マスタ項目識別情報とデータ項目識別情報の組み合わせ」中のマスタ項目識別情報と、受取部102dで受け取ったマスタが保持する、当該マスタ項目識別情報で特定される項目に係る値
For example, when the dictionary-using name matching
[51] The
[511] “The value related to the item specified by the data item identification information in the “combination of master item identification information and data item identification information” held by the form data received by the receiving
[53] The magnitude of the aggregate value obtained in [52] is compared with one threshold value or a plurality of mutually different threshold values, and the following information is used as the name matching result, for example, in the ERP of the transfer source of the form data table and the master table. The system 200 is used as the output destination.
・Contents according to the comparison results (e.g., a symbol that means the accuracy of name matching is high (e.g., ○), a symbol that means that the accuracy of name matching is medium (e.g., △), a symbol that means that the accuracy of name matching is low, Symbols that mean things (e.g. ×))
・The master primary key item received by the receiving
- Identification using the master item identification information in the "combination of master item identification information and data item identification information" acquired by the
図30は、名寄せ実行部102gが出力する名寄せ結果などの一例を示す図である。
FIG. 30 is a diagram showing an example of the name matching results output by the name matching
提案情報出力部102hは、「受取部102dで受け取った帳票データが保持する、取得部102eが[43]で取得した各『マスタ項目識別情報とデータ項目識別情報の組み合わせ』中の各データ項目識別情報で特定される各項目に係る各値」と「受取部102dで受け取ったマスタが保持する主キー項目に係る値」とに関する特定の組み合わせが、名寄せ実行部102gにおいて所定回数以上記録された場合、当該特定の組み合わせのコード付与辞書データ(具体的にはコード付与辞書条件データ106pとコード付与辞書付与データ106q)への登録を提案するための提案情報(例えば、当該提案に関するテキスト情報)を、例えば帳票データとマスタの転送元のERPシステム200を出力先として出力する。
The proposal
[3.本実施形態のまとめ]
以上、本実施形態によれば、幅広い使用場面において名寄せを低コストで行うことができる。また、データの種類ごとに適した処理工程を設定し、使用場面ごとに処理工程を細かく設定でき、コード付与辞書による結果の表示を変えることで、人力による名寄せ結果の修正作業の負担が軽減される。
[3. Summary of this embodiment]
As described above, according to this embodiment, name matching can be performed at low cost in a wide range of usage situations. In addition, by setting the appropriate processing process for each type of data, making detailed settings for each usage situation, and changing the display of results using a code dictionary, the burden of manual correction of name matching results is reduced. Ru.
[4.他の実施形態]
本発明は、上述した実施形態以外にも、特許請求の範囲に記載した技術的思想の範囲内において種々の異なる実施形態にて実施されてよいものである。
[4. Other embodiments]
In addition to the embodiments described above, the present invention may be implemented in various different embodiments within the scope of the technical idea described in the claims.
例えば、実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。 For example, among the processes described in the embodiments, all or part of the processes described as being performed automatically can be performed manually, or all of the processes described as being performed manually can be performed manually. Alternatively, some of the steps can be performed automatically using known methods.
また、本明細書中や図面中で示した処理手順、制御手順、具体的名称、各処理の登録データや検索条件等のパラメータを含む情報、画面例、データベース構成については、特記する場合を除いて任意に変更することができる。 In addition, unless otherwise specified, information including processing procedures, control procedures, specific names, parameters such as registered data and search conditions for each process, screen examples, and database configurations shown in this specification and drawings are included. It can be changed arbitrarily.
また、情報処理装置100に関して、図示の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。
Further, regarding the
例えば、情報処理装置100が備える処理機能、特に制御部にて行われる各処理機能については、その全部または任意の一部を、CPUおよび当該CPUにて解釈実行されるプログラムにて実現してもよく、また、ワイヤードロジックによるハードウェアとして実現してもよい。尚、プログラムは、本実施形態で説明した処理を情報処理装置に実行させるためのプログラム化された命令を含む一時的でないコンピュータ読み取り可能な記録媒体に記録されており、必要に応じて情報処理装置100に機械的に読み取られる。すなわち、ROMまたはHDD(Hard Disk Drive)などの記憶部などには、OSと協働してCPUに命令を与え、各種処理を行うためのコンピュータプログラムが記録されている。このコンピュータプログラムは、RAMにロードされることによって実行され、CPUと協働して制御部を構成する。
For example, the processing functions provided in the
また、このコンピュータプログラムは、情報処理装置100に対して任意のネットワークを介して接続されたアプリケーションプログラムサーバに記憶されていてもよく、必要に応じてその全部または一部をダウンロードすることも可能である。
Further, this computer program may be stored in an application program server connected to the
また、本実施形態で説明した処理を実行するためのプログラムを、一時的でないコンピュータ読み取り可能な記録媒体に格納してもよく、また、プログラム製品として構成することもできる。ここで、この「記録媒体」とは、メモリーカード、USB(Universal Serial Bus)メモリ、SD(Secure Digital)カード、フレキシブルディスク、光磁気ディスク、ROM、EPROM(Erasable Programmable Read Only Memory)、EEPROM(登録商標)(Electrically Erasable and Programmable Read Only Memory)、CD-ROM(Compact Disk Read Only Memory)、MO(Magneto-Optical disk)、DVD(Digital Versatile Disk)、および、Blu-ray(登録商標) Disc等の任意の「可搬用の物理媒体」を含むものとする。 Further, a program for executing the processing described in this embodiment may be stored in a non-temporary computer-readable recording medium, or may be configured as a program product. Here, the "recording medium" includes a memory card, a USB (Universal Serial Bus) memory, an SD (Secure Digital) card, a flexible disk, a magneto-optical disk, a ROM, an EPROM (Erasable Programmable Read Only Memory), and an EE. PROM (registration Trademark) (Electrically Erasable and Programmable Read Only Memory), CD-ROM (Compact Disk Read Only Memory), MO (Magneto-Optical disk) ), DVD (Digital Versatile Disk), Blu-ray (registered trademark) Disc, etc. shall include any “portable physical medium”.
また、「プログラム」とは、任意の言語または記述方法にて記述されたデータ処理方法であり、ソースコードまたはバイナリコード等の形式を問わない。なお、「プログラム」は必ずしも単一的に構成されるものに限られず、複数のモジュールやライブラリとして分散構成されるものや、OSに代表される別個のプログラムと協働してその機能を達成するものをも含む。なお、実施形態に示した各装置において記録媒体を読み取るための具体的な構成および読み取り手順ならびに読み取り後のインストール手順等については、周知の構成や手順を用いることができる。 Further, a "program" is a data processing method written in any language or writing method, and does not matter in the form of source code or binary code. Note that a "program" is not necessarily limited to a unitary structure, but may be distributed as multiple modules or libraries, or may work together with separate programs such as an OS to achieve its functions. Including things. Note that well-known configurations and procedures can be used for the specific configuration and reading procedure for reading the recording medium in each device shown in the embodiments, and the installation procedure after reading.
記憶部に格納される各種のデータベース等は、RAM、ROM等のメモリ装置、ハードディスク等の固定ディスク装置、フレキシブルディスク、および、光ディスク等のストレージ手段であり、各種処理やウェブサイト提供に用いる各種のプログラム、テーブル、データベース、および、ウェブページ用ファイル等を格納する。 The various databases stored in the storage unit are storage devices such as memory devices such as RAM and ROM, fixed disk devices such as hard disks, flexible disks, and optical disks, and are used for various processing and website provision. Stores programs, tables, databases, web page files, etc.
また、情報処理装置100は、既知のパーソナルコンピュータまたはワークステーション等の情報処理装置として構成してもよく、また、任意の周辺装置が接続された当該情報処理装置として構成してもよい。また、情報処理装置100は、当該装置に本実施形態で説明した処理を実現させるソフトウェア(プログラムまたはデータ等を含む)を実装することにより実現してもよい。
Further, the
更に、装置の分散・統合の具体的形態は図示するものに限られず、その全部または一部を、各種の付加等に応じてまたは機能負荷に応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。すなわち、上述した実施形態を任意に組み合わせて実施してもよく、実施形態を選択的に実施してもよい。 Furthermore, the specific form of dispersion and integration of devices is not limited to what is shown in the diagram, and all or part of them can be functionally or physically divided into arbitrary units according to various additions or functional loads. It can be configured in a distributed/integrated manner. That is, the embodiments described above may be implemented in any combination, or the embodiments may be implemented selectively.
本発明は、特に、名寄せ処理において有用である。 The present invention is particularly useful in name matching processing.
100 情報処理装置
102 制御部
102a 第一設定部
102b 第二設定部
102c 第三設定部
102d 受取部
102e 取得部
102f 辞書使用名寄せ実行部
102g 名寄せ実行部
102h 提案情報出力部
104 通信インターフェース部
106 記憶部
106a 処理工程データ
106b クレンジング適用データ
106c クレンジング手法マスタ
106d 類似度計算手法マスタ
106e マスタ-処理工程マッピングデータ
106f マスタ-処理工程マッピング明細データ
106g マスタ一覧マスタ
106h マスタ項目マスタ
106i 名寄せ手法データ
106j コード付与設定データ
106k 列マッピングデータ
106m データテンプレートマスタ
106n データテンプレート項目マスタ
106p コード付与辞書条件データ
106q コード付与辞書付与データ
106r 操作ログデータ
106s 修正ログヘッダデータ
106t 修正ログ明細データ
108 入出力インターフェース部
112 入力装置
114 出力装置
200 ERPシステム
300 ネットワーク
100
102a First setting section
102b Second setting section
102c Third setting section
102d Receiving section
102e Acquisition part
102f Dictionary usage name matching execution unit
102g name matching execution part
102h Proposal
106a Processing process data
106b Cleansing application data
106c cleansing method master
106d Similarity calculation method master
106e Master processing process mapping data
106f Master processing process mapping detail data
106g Master list master
106h Master item master
106i name identification method data
106j Code assignment setting data
106k column mapping data
106m data template master
106n Data template item master
106p code assignment dictionary condition data
106q Code assignment dictionary assignment data
106r operation log data
106s modification log header data
106t Modification log
Claims (12)
クレンジング手法と類似度計算手法との手法組み合わせが名寄せ先データの項目である先項目と紐付けて格納され、且つ、名寄せ元データの項目である元項目と先項目との項目組み合わせを1つまたは複数含む名寄せ実行時に使用する項目組み合わせ集合が所定のパターンまたはレイアウトを有している名寄せ元データのテンプレートと紐付けて格納された記憶部にアクセス可能であり、
前記制御部は、
名寄せ元データと名寄せ先データを受け取る受取手段と、
前記受け取った名寄せ元データに付与されたテンプレートの識別情報に紐付く項目組み合わせ集合を、前記記憶部から取得し、取得した項目組み合わせ集合中の項目組み合わせごとに、当該項目組み合わせ中の先項目に紐付く手法組み合わせを、前記記憶部から取得する取得手段と、
1)前記取得した項目組み合わせ集合中の項目組み合わせと前記取得した手法組み合わせとの組み合わせごとに、11)前記受け取った名寄せ元データが保持する、当該項目組み合わせ中の元項目に係る値と、前記受け取った名寄せ先データが保持する、当該項目組み合わせ中の先項目に係る値と、に対する、当該手法組み合わせ中のクレンジング手法によるクレンジング処理と、12)クレンジング処理後の両値に対する、当該手法組み合わせ中の類似度計算手法による類似度計算処理と、を実行し、2)当該得られた各類似度を集計し、3)当該得られた集計値に基づく情報と、当該名寄せ先データが保持する、名寄せ先データを一意に識別するための先項目である識別先項目に係る値を、名寄せ結果として出力する名寄せ実行手段と、
を備え、さらに、
前記記憶部は、
名寄せ元データが保持する、項目組み合わせ集合中の元項目に係る値と、名寄せ先データが保持する識別先項目に係る値と、を紐付けて登録した辞書データ
を格納し、
前記制御部は、
前記受け取った名寄せ元データが保持する、前記取得した項目組み合わせ集合中の元項目に係る値が、前記辞書データに登録されたものと同じである場合に、前記辞書データに登録された識別先項目に係る値と、当該値が前記辞書データに登録されたものであることを示す情報を、名寄せ結果として出力する辞書使用名寄せ実行手段
を備え、
前記名寄せ実行手段は、前記受け取った名寄せ元データが保持する、前記取得した項目組み合わせ集合中の元項目に係る値が、前記辞書データに登録されたものと同じでなかった場合に、前記1)から前記3)の処理を実行すること、
を特徴とする情報処理装置。 An information processing device comprising a control unit,
A method combination of a cleansing method and a similarity calculation method is stored in association with a destination item that is an item of the source data, and one or more item combinations of the source item and destination item that are the items of the source data are stored. It is possible to access a storage unit in which a set of item combinations including multiple items used when performing name matching is stored in association with a template of the name matching source data having a predetermined pattern or layout ;
The control unit includes:
a receiving means for receiving the reference data and the reference data;
The item combination set linked to the template identification information given to the received name reference data is obtained from the storage unit, and for each item combination in the obtained item combination set, the item combination set is linked to the previous item in the item combination. an acquisition means for acquiring a combination of methods from the storage unit;
1) For each combination of the item combination in the acquired item combination set and the acquired method combination, 11) The value related to the original item in the item combination held by the received name matching source data and the value of the received item combination. 12) Cleansing processing by the cleansing method in the method combination for the value related to the previous item in the item combination held by the name identification data held by the name matching destination data, and 12) similarity in the method combination for both values after the cleansing process. 2) aggregate each of the obtained similarities, and 3) collect information based on the obtained aggregate value and the name reference data held by the name reference data. a name matching execution means that outputs a value related to an identification destination item that is a destination item for uniquely identifying data as a name matching result;
In addition,
The storage unit includes:
Dictionary data that is registered by linking the value related to the source item in the item combination set held by the name reference data and the value related to the identification destination item held by the name reference data.
store and
The control unit includes:
If the value of the source item in the acquired item combination set held by the received name identification data is the same as that registered in the dictionary data, the identification target item registered in the dictionary data. Dictionary-using name matching execution means that outputs a value related to , and information indicating that the value is registered in the dictionary data, as a name matching result.
Equipped with
The name matching execution means performs the above 1) when the value of the original item in the acquired item combination set held by the received name matching source data is not the same as that registered in the dictionary data. Executing the process of 3) above from
An information processing device characterized by:
前記取得手段は、前記取得した項目組み合わせ集合中の項目組み合わせごとに、当該項目組み合わせ中の先項目に紐付く重み付け値を、前記記憶部からさらに取得し、
前記名寄せ実行手段は、各類似度に前記取得した各重み付け値を掛け合わせて各類似度を集計すること、
を特徴とする請求項1に記載の情報処理装置。 The storage unit further stores the weighted value in association with the previous item,
The acquisition means further acquires, for each item combination in the acquired item combination set, a weighting value linked to a previous item in the item combination from the storage unit,
The name aggregation executing means multiplies each degree of similarity by each of the obtained weighting values to total each degree of similarity;
The information processing device according to claim 1, characterized in that:
を特徴とする請求項1または2に記載の情報処理装置。 The name matching execution means compares the total value with one threshold value or a plurality of mutually different threshold values, and outputs content according to the comparison result as information based on the total value;
The information processing device according to claim 1 or 2, characterized in that:
を特徴とする請求項1から3のいずれか1つに記載の情報処理装置。 The name matching execution means further outputs, as a name matching result, a value related to a previous item in the acquired item combination set, which is held by the received name matching destination data;
The information processing device according to any one of claims 1 to 3, characterized in that:
1)手法組み合わせを複数含む手法組み合わせ集合と、
2)先項目と手法組み合わせの識別情報との先項目・手法組み合わせを、名寄せ先データ中の先項目の個数分含む先項目・手法組み合わせ集合を、名寄せ先データ別に複数含む先項目・手法組み合わせ集合族と、
3)項目組み合わせ集合を1つまたは複数含む項目組み合わせ集合族と、
4)項目組み合わせ集合の識別情報と先項目・手法組み合わせ集合の識別情報との組み合わせを1つまたは複数含む第一組み合わせ集合を1つまたは複数含む第一組み合わせ集合族と、
5)第一組み合わせ集合の識別情報と名寄せ元データのテンプレートの識別情報との組み合わせを1つまたは複数含む第二組み合わせ集合と、
を格納しているものであり、
前記取得手段は、
1)前記受け取った名寄せ元データ中のテンプレートの識別情報に紐付く第一組み合わせ集合の識別情報を、前記第二組み合わせ集合から取得し、
2)前記取得した第一組み合わせ集合の識別情報で特定される第一組み合わせ集合を、前記第一組み合わせ集合族から取得し、
3)前記取得した第一組み合わせ集合中の項目組み合わせ集合の識別情報で特定される項目組み合わせ集合を、前記項目組み合わせ集合族から取得するとともに、前記取得した第一組み合わせ集合中の先項目・手法組み合わせ集合の識別情報で特定される先項目・手法組み合わせ集合を、前記先項目・手法組み合わせ集合族から取得し、
4)前記取得した先項目・手法組み合わせ集合から、前記取得した項目組み合わせ集合中の先項目に紐付く手法組み合わせを取得すること、
を特徴とする請求項1から4のいずれか1つに記載の情報処理装置。 The storage unit includes:
1) A method combination set including multiple method combinations,
2) A destination item/method combination set that includes a plurality of destination item/method combination sets for each destination data, each containing a destination item/method combination of the destination item and the identification information of the method combination, as many as the number of destination items in the destination data. With the family,
3) an item combination set family containing one or more item combination sets;
4) a first combination set family that includes one or more first combination sets that include one or more combinations of identification information of an item combination set and identification information of a previous item/method combination set;
5) a second combination set including one or more combinations of the identification information of the first combination set and the identification information of the template of the name reference data;
It stores
The acquisition means is
1) obtaining the identification information of the first combination set linked to the identification information of the template in the received name matching source data from the second combination set;
2) acquiring a first combination set specified by the identification information of the acquired first combination set from the first combination set family;
3) Acquire the item combination set specified by the identification information of the item combination set in the acquired first combination set from the item combination set group, and also acquire the previous item/method combination in the acquired first combination set. obtaining a previous item/method combination set specified by the identification information of the set from the previous item/method combination set family;
4) obtaining a method combination linked to a previous item in the obtained item combination set from the obtained previous item/method combination set;
The information processing device according to any one of claims 1 to 4.
クレンジング手法を設定させるための領域と、類似度計算手法を設定させるための領域とを含む第一の設定画面を介して、オペレータに、手法組み合わせを設定させる第一設定手段と、
名寄せ先データを設定させるための領域と、設定された名寄せ先データ中の先項目を表示させるための領域と、先項目に適用する手法組み合わせを設定させるための領域と、を含む第二の設定画面を介して、オペレータに、先項目・手法組み合わせ集合を設定させる第二設定手段と、
名寄せ元データのテンプレートを設定させるための領域と、名寄せ先データを設定させるための領域と、先項目・手法組み合わせ集合を設定させるための領域と、設定された名寄せ先データ中の先項目と設定されたテンプレート中の元項目とを表示させ、項目組み合わせ集合を設定させるための領域と、を含む第三の設定画面を介して、オペレータに、項目組み合わせ集合、名寄せ元データのテンプレートおよび先項目・手法組み合わせ集合の紐付けを設定させる第三設定手段と、
をさらに備えること、
を特徴とする請求項5に記載の情報処理装置。 The control unit includes:
a first setting means for causing an operator to set a method combination via a first setting screen including an area for setting a cleansing method and an area for setting a similarity calculation method;
A second setting including an area for setting the reference data, an area for displaying the destination item in the set reference data, and an area for setting the method combination to be applied to the destination item. a second setting means for causing an operator to set a destination item/method combination set via a screen;
An area for setting the template of the reference data, an area for setting the reference data, an area for setting the destination item/method combination set, and the destination item and setting in the set reference data. The third setting screen, which includes an area for displaying the source items in the template and setting the item combination set, allows the operator to set the item combination set, the source data template, and the destination item. a third setting means for setting the linkage of the method combination set;
further equipping;
The information processing device according to claim 5, characterized in that:
前記名寄せ実行手段において、前記受け取った名寄せ元データが保持する、前記取得した項目組み合わせ集合中の元項目に係る値と、前記受け取った名寄せ先データが保持する識別先項目に係る値との特定の組み合わせが、所定回数以上記録された場合、当該特定の組み合わせの前記辞書データへの登録を提案するための情報を出力する提案情報出力手段
をさらに備えること、
を特徴とする請求項1に記載の情報処理装置。 The control unit includes:
The name matching execution means specifies a value related to the source item in the acquired item combination set held by the received name matching source data and a value related to the identification destination item held by the received name matching destination data. further comprising a suggestion information output means for outputting information for proposing registration of the specific combination in the dictionary data when the combination is recorded a predetermined number of times or more;
The information processing device according to claim 1 , characterized in that:
前記出力は、名寄せ元データと名寄せ先データの転送元のERPに係るアプリケーションソフトウェアを出力先とするものであること、
を特徴とする請求項1から7のいずれか1つに記載の情報処理装置。 The source data and destination data are transferred from application software related to ERP (Enterprise Resource Planning).
The output destination is the application software related to the ERP that is the transfer source of the source data and destination data;
The information processing device according to any one of claims 1 to 7 .
を特徴とする請求項8に記載の情報処理装置。 The name reference data must be the master set in the application software related to ERP,
The information processing device according to claim 8 , characterized in that:
を特徴とする請求項9に記載の情報処理装置。 The source data must be electronic data that has been digitized by OCR (Optical Character Recognition) or imported externally;
The information processing device according to claim 9 , characterized by:
前記制御部で実行される、
名寄せ元データと名寄せ先データを受け取る受取ステップと、
前記受け取った名寄せ元データに付与されたテンプレートの識別情報に紐付く項目組み合わせ集合を、前記記憶部から取得し、取得した項目組み合わせ集合中の項目組み合わせごとに、当該項目組み合わせ中の先項目に紐付く手法組み合わせを、前記記憶部から取得する取得ステップと、
1)前記取得した項目組み合わせ集合中の項目組み合わせと前記取得した手法組み合わせとの組み合わせごとに、11)前記受け取った名寄せ元データが保持する、当該項目組み合わせ中の元項目に係る値と、前記受け取った名寄せ先データが保持する、当該項目組み合わせ中の先項目に係る値と、に対する、当該手法組み合わせ中のクレンジング手法によるクレンジング処理と、12)クレンジング処理後の両値に対する、当該手法組み合わせ中の類似度計算手法による類似度計算処理と、を実行し、2)当該得られた各類似度を集計し、3)当該得られた集計値に基づく情報と、当該名寄せ先データが保持する、名寄せ先データを一意に識別するための先項目である識別先項目に係る値を、名寄せ結果として出力する名寄せ実行ステップと、
を含み、さらに、
前記記憶部は、
名寄せ元データが保持する、項目組み合わせ集合中の元項目に係る値と、名寄せ先データが保持する識別先項目に係る値と、を紐付けて登録した辞書データ
を格納し、
前記制御部で実行される、
前記受け取った名寄せ元データが保持する、前記取得した項目組み合わせ集合中の元項目に係る値が、前記辞書データに登録されたものと同じである場合に、前記辞書データに登録された識別先項目に係る値と、当該値が前記辞書データに登録されたものであることを示す情報を、名寄せ結果として出力する辞書使用名寄せ実行ステップ
を含み、
前記名寄せ実行ステップは、前記受け取った名寄せ元データが保持する、前記取得した項目組み合わせ集合中の元項目に係る値が、前記辞書データに登録されたものと同じでなかった場合に、前記1)から前記3)の処理を実行すること、
を特徴とする情報処理方法。 A method combination of a cleansing method and a similarity calculation method is stored in association with a destination item that is an item of the source data, and one or more item combinations of the source item and destination item that are the items of the source data are stored. The item combination set used when performing the name matching is executed by an information processing device equipped with a control unit that can access a storage unit in which a set of item combinations used when performing the name matching is stored in association with a template of the name matching source data having a predetermined pattern or layout. An information processing method comprising:
executed by the control unit,
a receiving step for receiving the reference data and the reference data;
The item combination set linked to the template identification information given to the received name reference data is obtained from the storage unit, and for each item combination in the obtained item combination set, the item combination set is linked to the previous item in the item combination. an acquisition step of acquiring a method combination from the storage unit;
1) For each combination of the item combination in the acquired item combination set and the acquired method combination, 11) The value related to the original item in the item combination held by the received name matching source data and the value of the received item combination. 12) Cleansing processing by the cleansing method in the method combination for the value related to the previous item in the item combination held by the name identification data held by the name matching destination data, and 12) similarity in the method combination for both values after the cleansing process. 2) aggregate each of the obtained similarities, and 3) collect information based on the obtained aggregate value and the name reference data held by the name reference data. a name matching execution step of outputting a value related to an identification destination item that is a destination item for uniquely identifying data as a name matching result;
including, and further,
The storage unit includes:
Dictionary data that is registered by linking the value related to the source item in the item combination set held by the name reference data and the value related to the identification destination item held by the name reference data.
store and
executed by the control unit,
If the value of the source item in the acquired item combination set held by the received name identification data is the same as that registered in the dictionary data, the identification target item registered in the dictionary data. a dictionary-using name matching execution step of outputting, as a name matching result, a value related to , and information indicating that the value is registered in the dictionary data;
including;
In the name matching execution step, if the value of the original item in the acquired item combination set held by the received name matching source data is not the same as the value registered in the dictionary data, the step of performing 1) Executing the process of 3) above from
An information processing method characterized by:
前記制御部に実行させるための、
名寄せ元データと名寄せ先データを受け取る受取ステップと、
前記受け取った名寄せ元データに付与されたテンプレートの識別情報に紐付く項目組み合わせ集合を、前記記憶部から取得し、取得した項目組み合わせ集合中の項目組み合わせごとに、当該項目組み合わせ中の先項目に紐付く手法組み合わせを、前記記憶部から取得する取得ステップと、
1)前記取得した項目組み合わせ集合中の項目組み合わせと前記取得した手法組み合わせとの組み合わせごとに、11)前記受け取った名寄せ元データが保持する、当該項目組み合わせ中の元項目に係る値と、前記受け取った名寄せ先データが保持する、当該項目組み合わせ中の先項目に係る値と、に対する、当該手法組み合わせ中のクレンジング手法によるクレンジング処理と、12)クレンジング処理後の両値に対する、当該手法組み合わせ中の類似度計算手法による類似度計算処理と、を実行し、2)当該得られた各類似度を集計し、3)当該得られた集計値に基づく情報と、当該名寄せ先データが保持する、名寄せ先データを一意に識別するための先項目である識別先項目に係る値を、名寄せ結果として出力する名寄せ実行ステップと、
を含み、さらに、
前記記憶部は、
名寄せ元データが保持する、項目組み合わせ集合中の元項目に係る値と、名寄せ先データが保持する識別先項目に係る値と、を紐付けて登録した辞書データ
を格納し、
前記制御部に実行させるための、
前記受け取った名寄せ元データが保持する、前記取得した項目組み合わせ集合中の元項目に係る値が、前記辞書データに登録されたものと同じである場合に、前記辞書データに登録された識別先項目に係る値と、当該値が前記辞書データに登録されたものであることを示す情報を、名寄せ結果として出力する辞書使用名寄せ実行ステップ
を含み、
前記名寄せ実行ステップは、前記受け取った名寄せ元データが保持する、前記取得した項目組み合わせ集合中の元項目に係る値が、前記辞書データに登録されたものと同じでなかった場合に、前記1)から前記3)の処理を実行すること、
を特徴とするプログラム。 A method combination of a cleansing method and a similarity calculation method is stored in association with a destination item that is an item of the source data, and one or more item combinations of the source item and destination item that are the items of the source data are stored. Execute by an information processing device equipped with a control unit that can access a storage unit in which a set of item combinations used when performing name matching that includes multiple items has a predetermined pattern or layout and is stored in association with a template of the name matching source data. It is a program for
for the control unit to execute,
a receiving step for receiving the reference data and the reference data;
The item combination set linked to the template identification information given to the received name reference data is obtained from the storage unit, and for each item combination in the obtained item combination set, the item combination set is linked to the previous item in the item combination. an acquisition step of acquiring a method combination from the storage unit;
1) For each combination of the item combination in the acquired item combination set and the acquired method combination, 11) The value related to the original item in the item combination held by the received name matching source data and the value of the received item combination. 12) Cleansing processing by the cleansing method in the method combination for the value related to the previous item in the item combination held by the name identification data held by the name matching destination data, and 12) similarity in the method combination for both values after the cleansing process. 2) aggregate each of the obtained similarities, and 3) collect information based on the obtained aggregate value and the name reference data held by the name reference data. a name matching execution step of outputting a value related to an identification destination item that is a destination item for uniquely identifying data as a name matching result;
including, and further,
The storage unit is
Dictionary data that is registered by linking the value related to the source item in the item combination set held by the name reference data and the value related to the identification destination item held by the name reference data.
store and
for the control unit to execute,
If the value of the source item in the acquired item combination set held by the received name identification data is the same as that registered in the dictionary data, the identification target item registered in the dictionary data. a dictionary-using name matching execution step of outputting, as a name matching result, a value related to , and information indicating that the value is registered in the dictionary data;
including;
In the name matching execution step, if the value of the original item in the acquired item combination set held by the received name matching source data is not the same as the value registered in the dictionary data, the step of performing 1) Executing the process of 3) above from
A program featuring.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2020106490A JP7397766B2 (en) | 2020-06-19 | 2020-06-19 | Information processing device, information processing method and program |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2020106490A JP7397766B2 (en) | 2020-06-19 | 2020-06-19 | Information processing device, information processing method and program |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2022002005A JP2022002005A (en) | 2022-01-06 |
| JP7397766B2 true JP7397766B2 (en) | 2023-12-13 |
Family
ID=79244494
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2020106490A Active JP7397766B2 (en) | 2020-06-19 | 2020-06-19 | Information processing device, information processing method and program |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP7397766B2 (en) |
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2004303037A (en) | 2003-03-31 | 2004-10-28 | Ntt Comware Corp | Bank integration support system, method and program |
| JP2011257854A (en) | 2010-06-07 | 2011-12-22 | Hitachi Ltd | Medical information management system, medical information management method and medical information management program |
| JP2012159885A (en) | 2011-01-28 | 2012-08-23 | Fujitsu Ltd | Information collation device, information collation system, information collation method and information collation program |
| JP2015075970A (en) | 2013-10-09 | 2015-04-20 | 前田建設工業株式会社 | Tabular data processing program, method and device |
-
2020
- 2020-06-19 JP JP2020106490A patent/JP7397766B2/en active Active
Patent Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2004303037A (en) | 2003-03-31 | 2004-10-28 | Ntt Comware Corp | Bank integration support system, method and program |
| JP2011257854A (en) | 2010-06-07 | 2011-12-22 | Hitachi Ltd | Medical information management system, medical information management method and medical information management program |
| JP2012159885A (en) | 2011-01-28 | 2012-08-23 | Fujitsu Ltd | Information collation device, information collation system, information collation method and information collation program |
| JP2015075970A (en) | 2013-10-09 | 2015-04-20 | 前田建設工業株式会社 | Tabular data processing program, method and device |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2022002005A (en) | 2022-01-06 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US10409820B2 (en) | Semantic mapping of form fields | |
| CN112199366A (en) | Data table processing method, device and equipment | |
| CN110580189A (en) | method and device for generating front-end page, computer equipment and storage medium | |
| JP2025108464A (en) | Program, method, information processing device, and system | |
| CN117389538A (en) | Page component content development method, device, equipment and storage medium | |
| CN120457434A (en) | System and method for analyzing and generating document metadata | |
| JP7397766B2 (en) | Information processing device, information processing method and program | |
| CN115879980A (en) | Method and device for passenger group circle selection and comparative analysis | |
| JP7050145B2 (en) | Display definition creation device, display definition creation method, and display definition creation program | |
| US20190265954A1 (en) | Apparatus and method for assisting discovery of design pattern in model development environment using flow diagram | |
| US20090112842A1 (en) | Methods and apparatus for web-based research | |
| JPWO2016147219A1 (en) | Text visualization system, text visualization method, and program | |
| US20190026814A1 (en) | Classification of Visitor Intent and Modification of Website Features Based upon Classified Intent | |
| WO2018206819A1 (en) | Data storage method and apparatus | |
| JP7385423B2 (en) | Unit price management device, unit price management method, and unit price management program | |
| US20230046572A1 (en) | Method for maintaining object arrangement order | |
| JP2019133227A (en) | Design support device, design support method and program | |
| JP7768844B2 (en) | Test preparation efficiency improvement device, test preparation efficiency improvement method, and test preparation efficiency improvement program | |
| JP7445555B2 (en) | Document navigation device, document navigation method, and document navigation program | |
| JP6997513B2 (en) | Numbering control device, numbering control method and numbering control program | |
| CN112434239B (en) | Configuration information determination method, page display method, device, equipment and storage medium | |
| JP7300039B2 (en) | Data extraction device, data extraction method and data extraction program | |
| JP2021125047A (en) | Production control device, production control method, and production control program | |
| JP7701857B2 (en) | Appropriate icon suggestion device, appropriate icon suggestion method, and appropriate icon suggestion program | |
| JP7449170B2 (en) | Order entry work support device, order entry work support method, and order entry work support program |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221111 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230808 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230809 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230925 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231107 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231201 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7397766 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |