JP6764779B2 - 同義カラム候補選出装置、同義カラム候補選出方法、及び同義カラム候補選出プログラム - Google Patents
同義カラム候補選出装置、同義カラム候補選出方法、及び同義カラム候補選出プログラム Download PDFInfo
- Publication number
- JP6764779B2 JP6764779B2 JP2016251592A JP2016251592A JP6764779B2 JP 6764779 B2 JP6764779 B2 JP 6764779B2 JP 2016251592 A JP2016251592 A JP 2016251592A JP 2016251592 A JP2016251592 A JP 2016251592A JP 6764779 B2 JP6764779 B2 JP 6764779B2
- Authority
- JP
- Japan
- Prior art keywords
- column
- synonymous
- data model
- rare
- mapping
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3332—Query translation
- G06F16/3338—Query expansion
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/247—Thesauruses; Synonyms
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/214—Database migration support
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/374—Thesaurus
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/80—Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
- G06F16/84—Mapping; Conversion
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/177—Editing, e.g. inserting or deleting of tables; using ruled lines
- G06F40/18—Editing, e.g. inserting or deleting of tables; using ruled lines of spreadsheets
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
w1*MatchCName(x1,y1)
+w2*MatchTName(x2,y2)
+w3*MatchCType(x3,y3)
+w4*MatchDataRange(x4,y4)・・・(1)
MatchTName(x2,y2)は、テーブル名マッチ度算出式であり、例えば、x2とy2とが一致すれば1となり、そうでなければ0となる。
MatchCType(x3,y3)は、カラム型マッチ度算出式であり、例えば、x3とy3とが一致すれば1となり、そうでなければ0となる。
MatchDataRange(x4,y4)は、データ値範囲マッチ度算出式であり、例えば、x4とy4とが一致すれば1となり、そうでなければ0となる。
w1*MatchCName(xi1,yi1)
+w2*MatchTName(xi2,yi2)
+w3*MatchCType(xi3,yi3)
+w4*MatchDataRange(xi4,yi4)・・・(3)
MatchTName(xi2,yi2)は、テーブル名マッチ度算出式であり、例えば、xi2とyi2が一致すれば1となり、そうでなければ0となる。
MatchCType(xi3,yi3)は、カラム型マッチ度算出式であり、例えば、xi3とyi3が一致すれば1となり、そうでなければ0となる。
MatchDataRange(xi4,yi4)は、データ値範囲マッチ度算出式であり、例えば、xi4とyi4が一致すれば1となり、そうでなければ0となる。
Claims (15)
- 第1データモデルのカラムと同義であるカラムの候補である同義カラム候補を第2データモデルから検出する同義カラム候補選出装置であって、
前記同義カラム候補選出装置のプロセッサは、
前記第1データモデルにおける各テーブルの構成に係る語であって、前記第1データモデルにおける自テーブル以外のテーブルの構成に係る語として存在する個数が所定数以下である1以上の第1希少語を検出するとともに、前記第2データモデルにおける各テーブルの構成に係る語であって、前記第2データモデルにおける自テーブル以外のテーブルの構成に係る語として存在する個数が所定数以下である1以上の第2希少語を検出する希少語検出処理を実行し、
前記第2データモデルの第2カラムが、前記第1データモデルの第1カラムの同義カラム候補であることを判定するための所定の判定条件を満たすか否かを判定する判定処理を実行し、
前記判定条件を満たす場合に、前記第2カラムを前記第1カラムの同義カラム候補として選出する選出処理を実行し、
前記判定条件は、前記第1カラムの周囲における前記第1希少語のいずれかと、前記第2カラムの周囲における前記第2希少語のいずれかと、が一致することである希少語判定条件を含む
同義カラム候補選出装置。 - 前記プロセッサは、
前記第1カラムと、前記第1カラムの同義カラム候補として選定された前記第2カラムと、を表示出力する
請求項1に記載の同義カラム候補選出装置。 - 前記プロセッサは、
前記第1カラムと前記第2カラムとのカラムの特徴の類似度であるカラム特徴類似度を特定し、
前記判定条件は、前記カラム特徴類似度が所定の閾値以上であることである条件を含む
請求項1又は請求項2に記載の同義カラム候補選出装置。 - 前記プロセッサは、
前記カラム特徴類似度が所定の閾値以上である第1カラムと第2カラムとを対象に、前記判定処理を実行する
請求項3に記載の同義カラム候補選出装置。 - 前記プロセッサは、
同一の第1カラムとの前記カラム特徴類似度が所定の閾値以上であると特定された所定数以上の第2カラムと、前記第1カラムとを対象に、前記判定処理を実行する
請求項4に記載の同義カラム候補選出装置。 - 前記判定条件は、前記第1カラムの周囲における前記第1希少語のいずれかと、前記第2カラムの周囲における前記第2希少語のいずれかと、が一致することには、前記第1希少語のいずれかと、前記第2希少語のいずれかとが部分一致する場合も含む
請求項1から請求項5のいずれか一項に記載の同義カラム候補選出装置。 - 前記所定数は、0である
請求項1から請求項6のいずれか一項に記載の同義カラム選出装置。 - 前記第1カラムの周囲とは、前記第1カラムを含む第1テーブル、又は前記第1テーブルと前記第1テーブルの上位又は下位の少なくとも一方のテーブルを含む範囲であり、前記第2カラムの周囲とは、前記第2カラムを含む第2テーブル、又は前記第2テーブルと前記第2テーブルの上位又は下位の少なくとも一方のテーブルを含む範囲である
請求項1から請求項7のいずれか一項に記載の同義カラム選出装置。 - 前記プロセッサは、
ユーザからの、判定条件として、希少語判定条件を含めるか否かの指定を受け付け、
前記希少語判定条件を含めないとの指定を受け付けた場合には、前記判定処理において、前記希少語判定条件以外の条件を満たすか否かを判定する
請求項1から請求項8のいずれか一項に記載の同義カラム候補選出装置。 - 前記プロセッサは、
ユーザからの同一の希少語とみなす語の組の指定を受け付け、
前記受け付けた語の組を記憶装置に記憶させ、
前記第1カラムの周囲における前記第1希少語のいずれかと、前記第2カラムの周囲における前記第2希少語のいずれかと、が一致することには、前記第1希少語のいずれかと、前記第2希少語のいずれかとの組が、前記語の組と一致する場合も含む
請求項1から請求項9のいずれか一項に記載の同義カラム候補選出装置。 - 前記プロセッサは、
ユーザからの、第1カラムと、前記第1カラムの同義カラムとする第2カラムとを指定する同義カラム確定情報を取得し、
前記同義カラム確定情報に基づいて、前記第2テーブルに前記第1テーブルの第1カラムの同義カラム候補となる第2カラムが存在する可能性を示すテーブル類似度を特定し、
前記テーブル類似度が所定値以上である前記第1テーブル及び前記第2テーブルについて、同義カラムが確定していない第1カラムに対する同義カラム候補として、同義カラムとして指定されていない第2カラムを選出する
請求項8に記載の同義カラム候補選出装置。 - 前記プロセッサは、
前記第1データモデル又は前記第2データモデルの一方のテーブル構成に係る語を、他方のテーブル構成に係る語の言語に翻訳し、
前記翻訳後のテーブル構成に係る語を利用して、前記希少語検出処理、前記判定処理を実行する
請求項1から請求項11のいずれか一項に記載の同義カラム候補選出装置。 - 前記プロセッサは、
前記第1カラムと、前記第2カラムとのカラム特徴類似度を所定の計算式に基づいて特定し、
ユーザからの、第1カラムと、前記第1カラムの同義カラムとする第2カラムとを指定する同義カラム確定情報を取得し、
前記同義カラム確定情報に含まれる前記第1カラムと、前記第2カラムとの前記カラム特徴類似度が高く特定されるように、前記計算式を調整する
請求項1から請求項12のいずれか一項に記載の同義カラム候補選出装置。 - 第1データモデルのカラムと同義であるカラムの候補である同義カラム候補を第2データモデルから検出する同義カラム候補選出装置による同義カラム候補選出方法であって、
前記同義カラム候補選出装置が、
前記第1データモデルにおける各テーブルの構成に係る語であって、前記第1データモデルにおける自テーブル以外のテーブルの構成に係る語として存在する個数が所定数以下である1以上の第1希少語を検出するとともに、前記第2データモデルにおける各テーブルの構成に係る語であって、前記第2データモデルにおける自テーブル以外のテーブルの構成に係る語として存在する個数が所定数以下である1以上の第2希少語を検出する希少語検出処理を実行し、
前記第2データモデルの第2カラムが、前記第1データモデルの第1カラムの同義カラム候補であることを判定するための所定の判定条件を満たすか否かを判定する判定処理を実行し、
前記判定条件を満たす場合に、前記第2カラムを前記第1カラムの同義カラム候補として選出する選出処理を実行し、
前記判定条件は、前記第1カラムの周囲における前記第1希少語のいずれかと、前記第2カラムの周囲における前記第2希少語のいずれかと、が一致することである希少語判定条件を含む
同義カラム候補選出方法。 - 第1データモデルのカラムと同義であるカラムの候補である同義カラム候補を第2データモデルから検出する同義カラム候補選出装置を構成するコンピュータに実行させるための同義カラム候補選出プログラムであって、
前記コンピュータに、
前記第1データモデルにおける各テーブルの構成に係る語であって、前記第1データモデルにおける自テーブル以外のテーブルの構成に係る語として存在する個数が所定数以下である1以上の第1希少語を検出するとともに、前記第2データモデルにおける各テーブルの構成に係る語であって、前記第2データモデルにおける自テーブル以外のテーブルの構成に係る語として存在する個数が所定数以下である1以上の第2希少語を検出する希少語検出処理を実行させ、
前記第2データモデルの第2カラムが、前記第1データモデルの第1カラムの同義カラム候補であることを判定するための所定の判定条件を満たすか否かを判定する判定処理を実行させ、
前記判定条件を満たす場合に、前記第2カラムを前記第1カラムの同義カラム候補として選出する選出処理を実行させ、
前記判定条件は、前記第1カラムの周囲における前記第1希少語のいずれかと、前記第2カラムの周囲における前記第2希少語のいずれかと、が一致することである希少語判定条件を含む
同義カラム候補選出プログラム。
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2016251592A JP6764779B2 (ja) | 2016-12-26 | 2016-12-26 | 同義カラム候補選出装置、同義カラム候補選出方法、及び同義カラム候補選出プログラム |
| US15/792,883 US10936634B2 (en) | 2016-12-26 | 2017-10-25 | Synonymous column candidate selecting apparatus, synonymous column candidate selecting method, and synonymous column candidate selecting program |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2016251592A JP6764779B2 (ja) | 2016-12-26 | 2016-12-26 | 同義カラム候補選出装置、同義カラム候補選出方法、及び同義カラム候補選出プログラム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2018106400A JP2018106400A (ja) | 2018-07-05 |
| JP6764779B2 true JP6764779B2 (ja) | 2020-10-07 |
Family
ID=62629778
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2016251592A Expired - Fee Related JP6764779B2 (ja) | 2016-12-26 | 2016-12-26 | 同義カラム候補選出装置、同義カラム候補選出方法、及び同義カラム候補選出プログラム |
Country Status (2)
| Country | Link |
|---|---|
| US (1) | US10936634B2 (ja) |
| JP (1) | JP6764779B2 (ja) |
Families Citing this family (21)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2021220058A1 (en) | 2020-05-01 | 2021-11-04 | Monday.com Ltd. | Digital processing systems and methods for enhanced collaborative workflow and networking systems, methods, and devices |
| WO2021161104A1 (en) | 2020-02-12 | 2021-08-19 | Monday.Com | Enhanced display features in collaborative network systems, methods, and devices |
| US11410129B2 (en) | 2010-05-01 | 2022-08-09 | Monday.com Ltd. | Digital processing systems and methods for two-way syncing with third party applications in collaborative work systems |
| WO2021144656A1 (en) | 2020-01-15 | 2021-07-22 | Monday.Com | Digital processing systems and methods for graphical dynamic table gauges in collaborative work systems |
| CN110555203B (zh) * | 2018-05-31 | 2023-05-30 | 北京百度网讯科技有限公司 | 文本复述方法、装置、服务器及存储介质 |
| US11436359B2 (en) | 2018-07-04 | 2022-09-06 | Monday.com Ltd. | System and method for managing permissions of users for a single data type column-oriented data structure |
| US11698890B2 (en) * | 2018-07-04 | 2023-07-11 | Monday.com Ltd. | System and method for generating a column-oriented data structure repository for columns of single data types |
| US12353419B2 (en) | 2018-07-23 | 2025-07-08 | Monday.com Ltd. | System and method for generating a tagged column-oriented data structure |
| EP4062313A1 (en) | 2019-11-18 | 2022-09-28 | Monday.com Ltd. | Collaborative networking systems, methods, and devices |
| US11829953B1 (en) | 2020-05-01 | 2023-11-28 | Monday.com Ltd. | Digital processing systems and methods for managing sprints using linked electronic boards |
| US11277361B2 (en) | 2020-05-03 | 2022-03-15 | Monday.com Ltd. | Digital processing systems and methods for variable hang-time for social layer messages in collaborative work systems |
| US11531452B2 (en) | 2021-01-14 | 2022-12-20 | Monday.com Ltd. | Digital processing systems and methods for group-based document edit tracking in collaborative work systems |
| WO2022153122A1 (en) | 2021-01-14 | 2022-07-21 | Monday.com Ltd. | Systems, methods, and devices for enhanced collaborative work documents |
| JP7606932B2 (ja) | 2021-06-04 | 2024-12-26 | 株式会社日立製作所 | データ管理システム及びデータ管理方法 |
| US12105948B2 (en) | 2021-10-29 | 2024-10-01 | Monday.com Ltd. | Digital processing systems and methods for display navigation mini maps |
| US11741071B1 (en) | 2022-12-28 | 2023-08-29 | Monday.com Ltd. | Digital processing systems and methods for navigating and viewing displayed content |
| US11886683B1 (en) | 2022-12-30 | 2024-01-30 | Monday.com Ltd | Digital processing systems and methods for presenting board graphics |
| US11893381B1 (en) | 2023-02-21 | 2024-02-06 | Monday.com Ltd | Digital processing systems and methods for reducing file bundle sizes |
| WO2024257014A1 (en) | 2023-06-13 | 2024-12-19 | Monday.com Ltd. | Digital processing systems and methods for enhanced data representation |
| WO2025114750A1 (en) | 2023-11-28 | 2025-06-05 | Monday.com Ltd. | Digital processing systems and methods for managing workflows |
| WO2025114749A1 (en) | 2023-11-28 | 2025-06-05 | Monday.com Ltd. | Digital processing systems and methods for facilitating the development and implementation of applications in conjunction with a serverless environment |
Family Cites Families (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6826568B2 (en) * | 2001-12-20 | 2004-11-30 | Microsoft Corporation | Methods and system for model matching |
| JP2003271656A (ja) * | 2002-03-19 | 2003-09-26 | Fujitsu Ltd | 関係付候補生成装置,関係付候補生成方法,関係付システム,関係付候補生成プログラムおよび同プログラムを記録したコンピュータ読取可能な記録媒体 |
| US20070185868A1 (en) * | 2006-02-08 | 2007-08-09 | Roth Mary A | Method and apparatus for semantic search of schema repositories |
| JP5506527B2 (ja) | 2010-04-26 | 2014-05-28 | 三菱電機株式会社 | 同義カラム検出装置及び同義カラム検出方法 |
| US10452661B2 (en) * | 2015-06-18 | 2019-10-22 | Microsoft Technology Licensing, Llc | Automated database schema annotation |
-
2016
- 2016-12-26 JP JP2016251592A patent/JP6764779B2/ja not_active Expired - Fee Related
-
2017
- 2017-10-25 US US15/792,883 patent/US10936634B2/en not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| US20180181650A1 (en) | 2018-06-28 |
| JP2018106400A (ja) | 2018-07-05 |
| US10936634B2 (en) | 2021-03-02 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP6764779B2 (ja) | 同義カラム候補選出装置、同義カラム候補選出方法、及び同義カラム候補選出プログラム | |
| JP5825122B2 (ja) | 生成プログラム、生成方法、および生成システム | |
| JP6359228B2 (ja) | 情報処理装置、情報処理方法及び情報処理プログラム | |
| CN106874281B (zh) | 实现数据库读写分离的方法和装置 | |
| JP2015512095A (ja) | 画像データベースにおける画像管理のための方法、装置、および、コンピュータで読取り可能な記録媒体 | |
| KR102243794B1 (ko) | 데이터 통합 장치 및 데이터 통합 방법 | |
| CN113961592A (zh) | 基于主从数据库的数据查询方法、装置、设备及存储介质 | |
| US9461884B2 (en) | Information management device and computer-readable medium recorded therein information management program | |
| JP6446819B2 (ja) | 文書差分表示プログラム及び情報処理装置 | |
| JP2021068365A5 (ja) | ||
| JP2021068365A (ja) | 計算機システム及びデータの管理方法 | |
| JP6546704B2 (ja) | データ処理方法、分散型データ処理システム及び記憶媒体 | |
| JP5600826B1 (ja) | 非構造化データ処理システム、非構造化データ処理方法およびプログラム | |
| US8836466B2 (en) | Monitoring system, device, monitoring method, and monitoring program | |
| JP6075051B2 (ja) | サーバ装置、電子会議システム及びプログラム | |
| JP6585327B1 (ja) | エピソード管理装置、エピソード管理プログラム及びエピソード管理方法 | |
| JP5358981B2 (ja) | 情報処理装置、情報処理装置の制御方法および情報処理装置の制御用プログラム | |
| JP2016031757A (ja) | 制御システム及び制御方法 | |
| JP6139399B2 (ja) | 分散クエリ処理装置、クエリ処理方法及びクエリ処理プログラム | |
| JP2019200532A (ja) | データ生成方法、データ生成プログラム及び情報処理装置 | |
| US11195121B2 (en) | Machine learning method and machine learning device | |
| JP2018106398A (ja) | テスト支援プログラムおよびテスト支援装置 | |
| JP6645240B2 (ja) | 検索処理方法、検索処理装置、及び検索処理プログラム | |
| TW201621713A (zh) | 解決方案搜尋系統之操作方法及解決方案搜尋系統 | |
| JPWO2018061070A1 (ja) | 計算機システム及び分析ソースデータ管理方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190226 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20191218 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20191224 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200214 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200825 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200914 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 6764779 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| LAPS | Cancellation because of no payment of annual fees |