JP5779529B2 - 類似設計書検索システム及び類似設計書検索方法 - Google Patents
類似設計書検索システム及び類似設計書検索方法 Download PDFInfo
- Publication number
- JP5779529B2 JP5779529B2 JP2012063878A JP2012063878A JP5779529B2 JP 5779529 B2 JP5779529 B2 JP 5779529B2 JP 2012063878 A JP2012063878 A JP 2012063878A JP 2012063878 A JP2012063878 A JP 2012063878A JP 5779529 B2 JP5779529 B2 JP 5779529B2
- Authority
- JP
- Japan
- Prior art keywords
- design document
- character
- character string
- document
- existing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Stored Programmes (AREA)
Description
前記設計書解析処理ユニットが、入力した新設計書に含まれる改行毎の文字列を抽出して前記汎用連想計算システムに出力する第1工程と、
前記類似設計書出力ユニットが、
前記汎用連想計算システムから出力された前記入力文字列と類似する既存設計書候補を入力する第2工程と、
該第2工程によって入力された既存設計書候補の文字列長さが前記新設計書文字列長さの所定数倍以上か否かを判定する第3工程と、
該第3工程によって既存設計書候補の文字列長さが前記新設計書文字列長さの所定数倍以上でないと判定したとき、該判定した既存設計書候補を蓄積する第4工程と、
該第4工程によって蓄積した既存設計書候補の文字列と前記新設計書文字列とを比較し、該新設計書文字列と一致する既存設計書文字列の文字色を標準色に対して変化させる第5工程と、
該第5工程によって一致文字色を変化させた既存設計書候補を類似度判定結果ファイルとして出力する第6工程とを実行することを第1の特徴とする。
新設計書文字列の文字と既存設計書文字列に含まれる文字とを対象とし、新設計書文字と既存設計書の文字が一致するか否かを既存設計書の先頭文字から順に比較する第7工程と、
該第7工程において既存設計書に一致する文字が無いと判定したとき、新設計書文字列の文字を先頭から1文字ずつ除外する第8工程と、
該第8工程により先頭文字を除外した新設計書文字と既存設計書の文字が一致するか否かを先頭文字から順に比較する第9工程と、
該第9工程において先頭文字を除外した新設計書文字と既存設計書の文字が一致しないと判定したとき、新設計書文字列の文字を最後尾から1文字ずつ除外する第10工程と、
該第10工程により最後尾文字を除外した新設計書文字と既存設計書の文字が一致するか否かを最後尾文字から順に比較する第11工程と、
を含むことを第2の特徴とし、
前記何れかの特徴の類似設計書検索システムにおいて、前記類似設計書出力ユニットが、前記第6工程によって出力された類似度判定結果ファイルを入力とし、該類似度判定結果ファイルに含まれる既存設計書候補に基づいて前記第1工程から第4工程とを実行する第12工程を実行し、該第12工程により蓄積した既存設計書候補に前記第4工程により蓄積した既存設計書候補が含まれているか否かを判定する第13工程とを実行することを第3の特徴とし、
前記何れかの特徴の類似設計書検索システムにおいて、前記第3工程における既存設計書候補の文字列長さが前記新設計書文字列長さの所定数倍を3倍にすることを第4の特徴とする。
前記設計書解析処理ユニットに、入力した新設計書に含まれる改行毎の文字列を抽出して前記汎用連想計算システムに出力する第1工程を実行させ、
前記類似設計書出力ユニットに、
前記汎用連想計算システムから出力された前記入力文字列と類似する既存設計書候補を入力する第2工程と、
該第2工程によって入力された既存設計書候補の文字列長さが前記新設計書文字列長さの所定数倍以上か否かを判定する第3工程と、
該第3工程によって既存設計書候補の文字列長さが前記新設計書文字列長さの所定数倍以上でないと判定したとき、該判定した既存設計書候補を蓄積する第4工程と、
該第4工程によって蓄積した既存設計書候補の文字列と前記新設計書文字列とを比較し、該新設計書文字列と一致する既存設計書文字列の文字色を標準色に対して変化させる第5工程と、
該第5工程によって一致文字色を変化させた既存設計書候補を類似度判定結果ファイルとして出力する第6工程とを実行させることを第5の特徴とする。
前記類似設計書出力ユニットに、前記第5工程における新設計書文字列と一致する既存設計書文字列の判定を、
前記類似設計書出力ユニットに、前記第5工程における新設計書文字列と一致する既存設計書文字列の判定を、
新設計書文字列の文字と既存設計書文字列に含まれる文字とを対象とし、新設計書文字と既存設計書の文字が一致するか否かを既存設計書の先頭文字から順に比較する第7工程と、
該第7工程において既存設計書に一致する文字が無いと判定したとき、新設計書文字列の文字を先頭から1文字ずつ除外する第8工程と、
該第8工程により先頭文字を除外した新設計書文字と既存設計書の文字が一致するか否かを先頭文字から順に比較する第9工程と、
該第9工程において先頭文字を除外した新設計書文字と既存設計書の文字が一致しないと判定したとき、新設計書文字列の文字を最後尾から1文字ずつ除外する第10工程と、
該第10工程により最後尾文字を除外した新設計書文字と既存設計書の文字が一致するか否かを最後尾文字から順に比較する第11工程と、
を含むことを第6の特徴とし、
前記何れかの特徴の類似設計書検索方法において、前記類似設計書出力ユニットに、前記第6工程によって出力された類似度判定結果ファイルを入力とし、該類似度判定結果ファイルに含まれる既存設計書候補に基づいて前記第1工程から第4工程とを実行する第12工程を実行させ、該第12工程により蓄積した既存設計書候補に前記第4工程により蓄積した既存設計書候補が含まれているか否かを判定する第13工程とを実行させることを第7の特徴とし、
前記何れかの特徴の類似設計書検索方法において、前記第3工程における既存設計書候補の文字列長さが前記新設計書文字列長さの所定数倍を3倍にすることを第8の特徴とする。
[構成]
まず、本発明による類似設計書検索方法及び類似設計書検索プログラムは、同様な機能を実行するモジュールのプログラムにおいては同様な設計書の記述内容に成り、設計書の最初の方の記述内容も同様になることを利用し、新設計書の最初(主要機能等の任意の箇所であっても良い)の記述内容を作成した段階で過去に作成した多数の既存設計書の中から類似する既存設計書を検索し、且つ、新設計書と既存設計書の類似箇所を色分け表示することによって、既存設計書を新設計書作成に利用するものである。
このように構成された類似設計書検索システムの全体動作は、図2に示す如く、設計書解析処理ユニット104が、入力している設計書ファイルのサンプル207の内容で構成される設計書ファイル107を入力する工程と、該入力した設計書ファイル107を汎用連想計算エンジン113が汎用連想計算エンジン辞書114を参照して解析(汎用連想計算エンジン辞書114に格納された連想辞書及び既存設計書の記述内容とを比較し、文字列の頻出度合いにより設計書の類似度を計算してランキングで出力する処理)する工程と、該汎用連想計算エンジン113が解析した解析結果を類似設計書出力ユニット103が類似度検索結果のサンプル208の形式で出力するために編集を行い、類似度検索結果110をHTML形式で出力する工程とを実行するように動作する。
103 類似設計書出力ユニット、104 設計書解析処理ユニット、
105 類似計算結果表示作成処理部、106 設計書解析処理部、
107 設計書ファィル、108 出力可否判定処理部、
109 設計書文書抽出処理部、110 類似度検索結果、
110 類似度検索結果ファイル、111 出力編集処理部、
112 汎用連想計算システム、113 汎用連想計算エンジン、
114 汎用連想計算エンジン辞書
Claims (8)
- 複数文字から成る文字列を項目毎に改行して表される設計書間の類似度を文字列の頻出度合いによって計算する汎用連想計算システムに接続され、入力した新設計書の文書構造を抽出する設計書文書抽出処理部及び該設計書文書抽出処理部により抽出した文書構造を解析する設計書解析処理部とを含む設計書解析処理ユニットと、該設計書解析処理ユニットにより解析した設計書の類似度判定結果ファイルを出力する類似設計書出力ユニットとを備えた類似設計書検索システムであって、
前記設計書解析処理ユニットが、入力した新設計書に含まれる改行毎の文字列を抽出して前記汎用連想計算システムに出力する第1工程と、
前記類似設計書出力ユニットが、
前記汎用連想計算システムから出力された前記入力文字列と類似する既存設計書候補を入力する第2工程と、
該第2工程によって入力された既存設計書候補の文字列長さが前記新設計書文字列長さの所定数倍以上か否かを判定する第3工程と、
該第3工程によって既存設計書候補の文字列長さが前記新設計書文字列長さの所定数倍以上でないと判定したとき、該判定した既存設計書候補を蓄積する第4工程と、
該第4工程によって蓄積した既存設計書候補の文字列と前記新設計書文字列とを比較し、該新設計書文字列と一致する既存設計書文字列の文字色を標準色に対して変化させる第5工程と、
該第5工程によって一致文字色を変化させた既存設計書候補を類似度判定結果ファイルとして出力する第6工程とを実行することを特徴とする類似設計書検索システム。 - 前記類似設計書出力ユニットが、前記第5工程における新設計書文字列と一致する既存設計書文字列の判定を、
新設計書文字列の文字と既存設計書文字列に含まれる文字とを対象とし、新設計書文字と既存設計書の文字が一致するか否かを既存設計書の先頭文字から順に比較する第7工程と、
該第7工程において既存設計書に一致する文字が無いと判定したとき、新設計書文字列の文字を先頭から1文字ずつ除外する第8工程と、
該第8工程により先頭文字を除外した新設計書文字と既存設計書の文字が一致するか否かを先頭文字から順に比較する第9工程と、
該第9工程において先頭文字を除外した新設計書文字と既存設計書の文字が一致しないと判定したとき、新設計書文字列の文字を最後尾から1文字ずつ除外する第10工程と、
該第10工程により最後尾文字を除外した新設計書文字と既存設計書の文字が一致するか否かを最後尾文字から順に比較する第11工程と、
を含むことを特徴とする請求項1記載の類似設計書検索システム。 - 前記類似設計書出力ユニットが、前記第6工程によって出力された類似度判定結果ファイルを入力とし、該類似度判定結果ファイルに含まれる既存設計書候補に基づいて前記第1工程から第4工程とを実行する第12工程を実行し、該第12工程により蓄積した既存設計書候補に前記第4工程により蓄積した既存設計書候補が含まれているか否かを判定する第13工程とを実行することを特徴とする請求項1又は2記載の類似設計書検索システム。
- 前記第3工程における既存設計書候補の文字列長さが前記新設計書文字列長さの所定数倍を3倍にすることを特徴とする請求項1から3何れかに記載の類似設計書検索システム。
- 複数文字から成る文字列を項目毎に改行して表される設計書間の類似度を文字列の頻出度合いによって計算する汎用連想計算システムに接続され、入力した新設計書の文書構造を抽出する設計書文書抽出処理部及び該設計書文書抽出処理部により抽出した文書構造を解析する設計書解析処理部とを含む設計書解析処理ユニットと、該設計書解析処理ユニットにより解析した設計書の類似度判定結果ファイルを出力する類似設計書出力ユニットとを備えたコンピュータシステムにおける類似設計書検索方法であって、
前記設計書解析処理ユニットに、入力した新設計書に含まれる改行毎の文字列を抽出して前記汎用連想計算システムに出力する第1工程を実行させ、
前記類似設計書出力ユニットに、
前記汎用連想計算システムから出力された前記入力文字列と類似する既存設計書候補を入力する第2工程と、
該第2工程によって入力された既存設計書候補の文字列長さが前記新設計書文字列長さの所定数倍以上か否かを判定する第3工程と、
該第3工程によって既存設計書候補の文字列長さが前記新設計書文字列長さの所定数倍以上でないと判定したとき、該判定した既存設計書候補を蓄積する第4工程と、
該第4工程によって蓄積した既存設計書候補の文字列と前記新設計書文字列とを比較し、該新設計書文字列と一致する既存設計書文字列の文字色を標準色に対して変化させる第5工程と、
該第5工程によって一致文字色を変化させた既存設計書候補を類似度判定結果ファイルとして出力する第6工程とを実行させることを特徴とする類似設計書検索方法。 - 前記類似設計書出力ユニットに、前記第5工程における新設計書文字列と一致する既存設計書文字列の判定を、
新設計書文字列の文字と既存設計書文字列に含まれる文字とを対象とし、新設計書文字と既存設計書の文字が一致するか否かを既存設計書の先頭文字から順に比較する第7工程と、
該第7工程において既存設計書に一致する文字が無いと判定したとき、新設計書文字列の文字を先頭から1文字ずつ除外する第8工程と、
該第8工程により先頭文字を除外した新設計書文字と既存設計書の文字が一致するか否かを先頭文字から順に比較する第9工程と、
該第9工程において先頭文字を除外した新設計書文字と既存設計書の文字が一致しないと判定したとき、新設計書文字列の文字を最後尾から1文字ずつ除外する第10工程と、
該第10工程により最後尾文字を除外した新設計書文字と既存設計書の文字が一致するか否かを最後尾文字から順に比較する第11工程と、
を含むことを特徴とする請求項5記載の類似設計書検索方法。 - 前記類似設計書出力ユニットに、前記第6工程によって出力された類似度判定結果ファイルを入力とし、該類似度判定結果ファイルに含まれる既存設計書候補に基づいて前記第1工程から第4工程とを実行する第12工程を実行させ、該第12工程により蓄積した既存設計書候補に前記第4工程により蓄積した既存設計書候補が含まれているか否かを判定する第13工程とを実行させることを特徴とする請求項5又は6記載の類似設計書検索方法。
- 前記第3工程における既存設計書候補の文字列長さが前記新設計書文字列長さの所定数倍を3倍にすることを特徴とする請求項5から7何れかに記載の類似設計書検索方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2012063878A JP5779529B2 (ja) | 2012-03-21 | 2012-03-21 | 類似設計書検索システム及び類似設計書検索方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2012063878A JP5779529B2 (ja) | 2012-03-21 | 2012-03-21 | 類似設計書検索システム及び類似設計書検索方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2013196468A JP2013196468A (ja) | 2013-09-30 |
| JP5779529B2 true JP5779529B2 (ja) | 2015-09-16 |
Family
ID=49395306
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2012063878A Expired - Fee Related JP5779529B2 (ja) | 2012-03-21 | 2012-03-21 | 類似設計書検索システム及び類似設計書検索方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP5779529B2 (ja) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP7775572B2 (ja) * | 2021-02-22 | 2025-11-26 | 沖電気工業株式会社 | テキスト分類装置、方法及びプログラム |
-
2012
- 2012-03-21 JP JP2012063878A patent/JP5779529B2/ja not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JP2013196468A (ja) | 2013-09-30 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Limsettho et al. | Automatic unsupervised bug report categorization | |
| US8533140B2 (en) | Method and system for design check knowledge construction | |
| CN107392143A (zh) | 一种基于svm文本分类的简历精确解析方法 | |
| JP4427500B2 (ja) | 意味解析装置、意味解析方法および意味解析プログラム | |
| CN114495143B (zh) | 一种文本对象识别方法、装置、电子设备及存储介质 | |
| CN114239588A (zh) | 文章处理方法、装置、电子设备及介质 | |
| Jankowska et al. | Relative N-gram signatures: Document visualization at the level of character N-grams | |
| CN107679035A (zh) | 一种信息意图检测方法、装置、设备和存储介质 | |
| CN115062148A (zh) | 一种基于数据库的风险控制方法 | |
| US20130013604A1 (en) | Method and System for Making Document Module | |
| JPWO2014064777A1 (ja) | 文書評価支援システム、及び文書評価支援方法 | |
| Jeon et al. | Making a graph database from unstructured text | |
| JP2011238159A (ja) | 計算機システム | |
| JP2015162004A (ja) | 開発ドキュメント間トレースリンク生成支援装置及び方法及びプログラム | |
| TW202139054A (zh) | 表單數據檢測方法、電腦裝置及儲存介質 | |
| US9218336B2 (en) | Efficient implementation of morphology for agglutinative languages | |
| CN102799584A (zh) | 一种针对检测仪器输出数据筛选提取的处理方法 | |
| JP5779529B2 (ja) | 類似設計書検索システム及び類似設計書検索方法 | |
| JP2013218507A (ja) | 構造解析装置及びプログラム | |
| CN119829021A (zh) | 一种基于生成对抗网络生成前端原型的方法 | |
| JP6747427B2 (ja) | 検索システム、検索方法および検索プログラム | |
| CN106462614B (zh) | 信息分析系统、信息分析方法以及信息分析程序 | |
| JP2008065468A (ja) | テキスト多重分類装置、テキストを多重分類する方法、プログラムおよび記憶媒体 | |
| KR20220097844A (ko) | 항목 및 항목 값 추출이 가능한 비정형 문서 처리장치 및 그 방법 | |
| Zhou et al. | Efficient web page main text extraction towards online news analysis |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140922 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150424 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150428 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150605 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150707 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150713 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 5779529 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| LAPS | Cancellation because of no payment of annual fees |