JP5544571B2 - Hierarchical structure management apparatus, method thereof, and program - Google Patents
Hierarchical structure management apparatus, method thereof, and program Download PDFInfo
- Publication number
- JP5544571B2 JP5544571B2 JP2010198934A JP2010198934A JP5544571B2 JP 5544571 B2 JP5544571 B2 JP 5544571B2 JP 2010198934 A JP2010198934 A JP 2010198934A JP 2010198934 A JP2010198934 A JP 2010198934A JP 5544571 B2 JP5544571 B2 JP 5544571B2
- Authority
- JP
- Japan
- Prior art keywords
- hierarchical structure
- word
- new
- words
- node
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、ファイルを多次元的な階層構造で管理する階層構造管理装置等に関する。 The present invention relates to a hierarchical structure management apparatus that manages files in a multidimensional hierarchical structure.
現代のオフィスでは個人のパソコンやファイルサーバに多数の電子ファイルが未整理のまま蓄積されている。企業等が新たな価値を創造するためには知的労働者の生産性を高める必要があるが、インフォメーションワーカーは、平均で労働時間の24%を情報の検索と分析に費やしているとの調査結果もあり(「The Hidden Costs of Information Work」,IDC(http://www.idc.com/),2006年4月を参照)、必要な情報を的確に検索する技術や蓄積されている情報の全体像を容易に把握する技術は、知的労働者の生産性を高める上で重要である。また、政府が打ち出したオープンガバメント構想は、国民に対する説明責任を果たしつつ政府や自治体の業務を効率化する上で重要性が高いが、これを推進する上でも政府や自治体が保有する多数の電子ファイルを系統的に整理する必要がある。民間企業においてもITガバナンスの重要性が増大しているため、業務の過程で蓄積された多数の電子ファイルを系統的に整理するニーズは大きい。 In modern offices, a large number of electronic files are stored unorganized on personal computers and file servers. Companies need to increase the productivity of intellectual workers to create new value, but information workers spend an average of 24% of their working hours searching and analyzing information There are also results ("The Hidden Costs of Information Work", IDC (http://www.idc.com/), refer to April 2006). Technology that easily grasps the whole picture is important to increase the productivity of intellectual workers. The open government initiative launched by the government is highly important for improving the efficiency of government and local government operations while fulfilling accountability to the public. Files need to be organized systematically. Since the importance of IT governance is also increasing in private companies, there is a great need for systematically organizing a large number of electronic files accumulated in the course of business.
コンピュータ上に蓄積されたファイルを整理する手法としては、フォルダ階層を用いる方法が一般的である。しかし、単一のフォルダ階層には様々な分類観点が混在しているため、(1)必要なファイルがどこにあるか分からない、(2)フォルダ階層の作成者でなければ分類階層を理解できない、(3)作成したファイルを格納すべき場所が特定できないといった問題がある。そのため、全文検索エンジンの導入やファイルへのタグ付け等の工夫が行われる場合もあるが、利用者が指定した検索キーワードと合致しないファイルや検索順位の低いファイルは埋もれてしまうため、本質的な問題解決にはならない。 As a method for organizing files stored on a computer, a method using a folder hierarchy is generally used. However, since various classification viewpoints are mixed in a single folder hierarchy, (1) I do not know where the necessary files are, (2) Only the creator of the folder hierarchy can understand the classification hierarchy, (3) There is a problem that the location where the created file should be stored cannot be specified. For this reason, ingenuity such as introduction of full-text search engines and tagging of files may be performed, but files that do not match the search keyword specified by the user or files with low search order are buried, which is essential. It does not solve the problem.
発明者らは、上記の問題点に対してファイルの階層構造を多次元的に管理する多次元分類方式を提案している(非特許文献1、2を参照)。多次元分類方式は、分類対象となるエンティティを複数の木構造と対応付けて分類する方式である。エンティティは電子的に保持されている情報であれば任意である。それぞれの木構造は、特定の観点に基づいたエンティティの分類基準を表現しており、親子の節点間にはIS−A関連(子節点は親節点の特別な場合に対応)が成立するように構築する(IS−A制約)。また、同一木構造の兄弟節点は互いに排他的なものとする(排他制約)。IS−A制約により分類基準の一貫性を保つことができ、排他制約によって分類基準の明確化が図られる。これによりMECEな木構造が構築され、木構造の理解も容易になるため、ファイルの分類作業や検索作業の効率が高まる。 The inventors have proposed a multidimensional classification method for managing the hierarchical structure of files in a multidimensional manner with respect to the above problems (see Non-Patent Documents 1 and 2). The multidimensional classification method is a method of classifying entities to be classified in association with a plurality of tree structures. An entity is arbitrary as long as it is information held electronically. Each tree structure represents entity classification criteria based on a specific point of view so that IS-A relations (child nodes correspond to special cases of parent nodes) are established between parent and child nodes. Build (IS-A constraint). Also, sibling nodes of the same tree structure are mutually exclusive (exclusive constraint). The IS-A constraint can keep the classification criteria consistent, and the exclusion constraint makes the classification criteria clear. As a result, a MECE tree structure is constructed and the tree structure can be easily understood, so that the efficiency of file classification work and search work increases.
多次元分類方式の特徴としては以下が挙げられる。(1)分類に用いる個別の木構造が一貫しており、比較的小規模になるため、利用者による木構造の理解、及び保守が容易である。(2)個別の木構造や木構造の節点を利用者が自由に指定してエンティティを検索できる。木構造や節点の指定順序も自由に指定できるため、検索の際の自由度が大きい。(3)蓄積されている情報の全体像を利用者が容易に把握できる。これにより所望の情報がシステムに登録されているか否かを素早く判断できる。 The characteristics of the multidimensional classification method include the following. (1) Since the individual tree structure used for classification is consistent and relatively small, it is easy for the user to understand and maintain the tree structure. (2) A user can freely specify an individual tree structure or a node of the tree structure to search for an entity. Since the tree structure and the node specification order can be specified freely, the degree of freedom in searching is great. (3) The user can easily grasp the overall image of the stored information. This makes it possible to quickly determine whether desired information is registered in the system.
また、ファイルへのアクセスを容易にする技術として、検出手段(CPU等)はPCに接続された複数のHDDを検出し、読出手段(CPU等)は検出された複数のHDDの各々からディレクトリツリーを読み出し、作成手段(CPU等)はディレクトリツリーにおいて最上位階層から順に同一階層内における同名フォルダを検索し、検索された同一階層内における同名フォルダを一つのフォルダとし、当該フォルダ内に当該フォルダに対応付
けられた下位階層のフォルダを書き込む動作を繰り返して仮想ディレクトリツリーを作成し、管理手段は(CPU等)仮想ディレクトリツリーに基づいてファイルへのアクセスを管理する技術が特許文献1に開示されている。
As a technique for facilitating access to a file, a detecting means (CPU or the like) detects a plurality of HDDs connected to a PC, and a reading means (CPU or the like) detects a directory tree from each of the detected plurality of HDDs. The creation means (CPU or the like) searches the directory tree for the same name folder in the same hierarchy in order from the highest level in the directory tree, sets the searched same name folder in the same hierarchy as one folder, and stores the same folder in the folder. Patent Document 1 discloses a technique in which a virtual directory tree is created by repeating an operation of writing a folder in a lower hierarchy that is associated, and a management unit (such as a CPU) manages access to a file based on the virtual directory tree. Yes.
しかしながら、非特許文献1、2に示す技術では、ファイルの管理を格段に行いやすくするものであるが、既存のファイルサーバや個人のパソコンに蓄積されている大量のファイルを多次元のツリーに移行するには、多くの手間と時間を要してしまうという課題を有する。 However, the technologies shown in Non-Patent Documents 1 and 2 make it much easier to manage files, but migrate a large amount of files stored in existing file servers or personal computers to a multidimensional tree. To achieve this, there is a problem that it takes a lot of labor and time.
特許文献1に示す技術は、最上位階層から順に同一階層内における同名フォルダを検索し、検索された同名フォルダを1つのフォルダにして、ファイルへのアクセスを容易化するものであるが、ある観点に基づいて階層構造を管理することができるものではなく、様々な分類観点が混在して管理されている階層構造に対して、ファイルへのアクセスを容易化するのに十分な技術ではないという課題を有する。 The technique disclosed in Patent Document 1 searches for the same name folder in the same hierarchy in order from the highest level, and makes the searched same name folder one folder to facilitate access to the file. It is not a technology that can manage the hierarchical structure based on the system, but is not sufficient technology to facilitate access to the file for the hierarchical structure that is managed by mixing various classification viewpoints. Have
そこで、本発明は様々な分類観点が混在して管理されている階層構造から、任意の観点に基づく階層構造を自動生成し、利用者にとって使い勝手のよい階層構造管理装置等を提供する。 Therefore, the present invention automatically generates a hierarchical structure based on an arbitrary viewpoint from a hierarchical structure managed by mixing various classification viewpoints, and provides a user-friendly hierarchical structure management apparatus and the like.
本願に開示する階層構造管理装置は、管理の対象となる複数の管理ファイルを格納するファイル格納手段と、前記管理ファイルと既存の旧階層構造における各ノードとを対応付けた対応情報、及び前記管理ファイルと新たに生成された新階層構造における各ノードとを対応付けた対応情報を記憶する対応情報記憶手段と、任意の一又は複数の単語からなる単語集合が入力された場合に、前記対応情報におけるノードの名称から前記入力された単語集合に含まれない単語を削除し、削除された結果名称が空になった空ノードについては当該空ノードを削除し、共通の親を有する兄弟関係のノードの中で、同一の名称となったノードを統合して前記対応情報を再構成する再構成手段とを備え、前記再構成手段が、前記空ノードを削除する場合に、当該空ノードの子ノード及び葉ノードについては直近の先祖ノードに対応付けるものである。 The hierarchical structure management device disclosed in the present application includes a file storage unit that stores a plurality of management files to be managed, correspondence information that associates the management file with each node in an existing old hierarchical structure, and the management Correspondence information storage means for storing correspondence information in which a file is associated with each node in the newly generated new hierarchical structure, and when the word set composed of any one or a plurality of words is input, the correspondence information Deletes a word that is not included in the input word set from the names of the nodes in the node, deletes the empty node for which the deleted name is empty, and deletes the empty node, and sibling-related nodes having a common parent And reconfiguring means for reconfiguring the correspondence information by integrating the nodes having the same name, and when the reconfiguring means deletes the empty node, It is intended to correspond to the nearest ancestor node for the child nodes and the leaf nodes of the spatial nodes.
このように、本願に開示する階層構造管理装置においては、管理されているファイルと既存の旧階層構造の各ノードとを対応付けた対応情報、及び管理されているファイルと新たに生成された新階層構造における各ノードとを対応付けた対応情報を記憶し、この対応情報について、任意の一又は複数の単語からなる単語集合が入力された場合に、ノードの名称から入力された単語集合に含まれない単語を削除し、削除された結果名称が空になっ
た空ノードについては空ノードを削除し、共通の親を有する兄弟関係のノードの中で、同一の名称となったノードを統合して対応情報を再構成し、共通の親を有する兄弟関係のノードの中で、同一の名称となったノードを統合し、空ノードを削除する場合に、当該空ノードの子ノード及び葉ノードについては直近の先祖ノードに対応付けるため、入力された任意の一又は複数の単語集合を観点とした階層構造を生成することができ、利用者が既存の階層構造から、任意の観点に基づく階層構造をカスタマイズして生成し、使い勝手がよいものになるという効果を奏する。
As described above, in the hierarchical structure management device disclosed in the present application, the correspondence information that associates the managed file with each node of the existing old hierarchical structure, and the newly created new file and the managed file. Correspondence information that associates each node in the hierarchical structure is stored, and when the word set consisting of one or more arbitrary words is input, this correspondence information is included in the word set input from the node name Delete the unrecognized word, delete the empty node for the empty node whose name is empty, and merge the nodes with the same name among the sibling nodes that have a common parent. When reconfiguring the correspondence information, integrating the nodes with the same name among sibling nodes with a common parent, and deleting the empty node, the child node and leaf node of the empty node In order to correspond to the nearest ancestor node, it is possible to generate a hierarchical structure based on any one or more input word sets, and the user can create a hierarchical structure based on an arbitrary viewpoint from the existing hierarchical structure. It is possible to customize and generate and to improve usability.
本願に開示する階層構造管理装置は、前記管理ファイルの名称、及び前記旧階層構造における各ノードの名称を形態素解析により分割して単語情報を作成する単語情報生成手段と、前記旧階層構造における全てのノードに関する前記単語情報について、階層レベルごとに、前記ノードの名称に重複して出現する重複単語を抽出すると共に、当該重複単語が抽出された場合に、前記単語情報のうち前記重複単語以外の単語集合について、前記再構成手段の処理を実行し、全ての階層レベルについて前記重複単語の抽出、及び前記再構成手段の処理が実行された後に最終的に残ったノードとファイルとの対応情報を第1の新階層構造として決定する第1階層構造決定手段を備えるものである。 The hierarchical structure management device disclosed in the present application includes a word information generation unit that generates word information by dividing the name of the management file and the name of each node in the old hierarchical structure by morphological analysis, and all of the old hierarchical structure As for the word information related to the node, for each hierarchical level, a duplicate word that appears redundantly in the name of the node is extracted, and when the duplicate word is extracted, the word information other than the duplicate word is extracted. The processing of the reconstruction means is executed for the word set, the duplicated word extraction is performed for all hierarchical levels, and the correspondence information between the nodes and files finally remaining after the processing of the reconstruction means is executed. A first hierarchical structure determining means for determining the first new hierarchical structure is provided.
このように、本願に開示する階層構造管理装置においては、管理ファイルの名称、及び旧階層構造における各ノードの名称を形態素解析により分割して単語情報を作成し、旧階層構造における全てのノードに関する単語情報について、階層レベルごとに、ノードの名称に重複して出現する重複単語を抽出し、重複単語以外の単語集合について、再構成手段の処理を実行し、全ての階層レベルについて重複単語の抽出、及び再構成手段の処理が実行された後に最終的に残ったノードとファイルとの対応情報を第1の新階層構造として決定するため、重複する単語が名称に含まれるノードについて重複をなくして排他的とし、一の観点で分類した階層構造を容易に自動生成することができるという効果を奏する。 Thus, in the hierarchical structure management device disclosed in the present application, the name of the management file and the name of each node in the old hierarchical structure are divided by morphological analysis to create word information, and all the nodes in the old hierarchical structure are related. For word information, for each hierarchical level, duplicate words that appear redundantly in the node name are extracted, the processing of the reconstruction means is executed for a word set other than the duplicate words, and duplicate words are extracted for all hierarchical levels And the correspondence information between the node and the file finally remaining after the processing of the reconstruction means is determined as the first new hierarchical structure, the duplication is eliminated for the node in which the duplicate word is included in the name. There is an effect that the hierarchical structure classified from one viewpoint can be automatically generated automatically.
本願に開示する階層構造管理装置は、前記第1階層構造決定手段で抽出された任意の一の重複単語について、前記第1の新階層構造を除く他の新階層構造がない場合は、その任意の一の重複単語のみを単語集合として、前記再構成手段の処理を実行して得られる対応情報を第2以降の他の新階層構造として決定し、前記第1の新階層構造を除く他の新階層構造がある場合は、当該他の新階層構造における各ノードの名称を構成する単語集合に、当該他の新階層構造ごとに前記任意の一の重複単語を追加したものを単語集合として前記再構成手段の処理を順次実行し、実行した結果再構成された階層構造に、前記追加した重複単語が1回しか出現しない場合には、当該再構成手段の処理により得られた対応情報を第2以降の他の新階層構造として決定し、前記追加した重複単語が複数回出現する場合には、当該追加した重複単語のみを単語集合として、前記再構成手段の処理を実行して得られる対応情報を第2以降の他の新階層構造として決定する処理を、前記全ての重複単語について実行して第2以降の新階層構造を決定する第n階層構造決定手段を備えるものである。 The hierarchical structure management device disclosed in the present application, when there is no other new hierarchical structure other than the first new hierarchical structure, for any one duplicate word extracted by the first hierarchical structure determining means, The correspondence information obtained by executing the processing of the reconfiguring means with only one overlapping word as a word set is determined as another new hierarchical structure after the second, and other than the first new hierarchical structure If there is a new hierarchical structure, the word set that constitutes the name of each node in the other new hierarchical structure is the word set obtained by adding the arbitrary one duplicate word for each other new hierarchical structure If the added duplicate word appears only once in the hierarchical structure reconstructed as a result of executing the processing of the reconstruction means sequentially, the correspondence information obtained by the processing of the reconstruction means is Other new hierarchies after 2 If the added duplicate word appears multiple times, the correspondence information obtained by executing the processing of the reconstructing means with only the added duplicate word as a word set is added to the second and subsequent new information. A process for determining a hierarchical structure is executed for all the duplicate words to provide an nth hierarchical structure determining means for determining the second and subsequent new hierarchical structures.
このように、本願に開示する階層構造管理装置においては、第1階層構造決定手段で抽出された任意の一の重複単語について、新階層構造における各ノードの名称を構成する単語集合に、他の新階層構造ごとに任意の一の重複単語を追加したものを単語集合として再構成手段の処理を順次実行し、再構成された階層構造に、追加した重複単語が1回しか出現しない場合には、その再構成された階層構造を第2以降の他の新階層構造として決定し、追加した重複単語が複数回出現する場合には、追加した重複単語のみを単語集合として、再構成手段の処理を実行して得られる階層構造を第2以降の他の新階層構造として決定することで、前記で得られた第1階層構造に加えて、別の観点で分類した第2以降の階層構造を生成することができ、様々な観点が混在する一の旧階層構造から、異なる観点で分類された複数の階層構造を容易に自動生成することができるという効果を奏する。 As described above, in the hierarchical structure management device disclosed in the present application, for any one duplicate word extracted by the first hierarchical structure determining means, the word set constituting the name of each node in the new hierarchical structure When the processing of the reconstruction means is sequentially executed as a word set by adding any one overlapping word for each new hierarchical structure, and the added overlapping word appears only once in the reconstructed hierarchical structure The reconstructed hierarchical structure is determined as another new hierarchical structure after the second, and when the added duplicate word appears a plurality of times, only the added duplicate word is regarded as a word set and processing of the reconstruction means In addition to the first hierarchical structure obtained above, the second and subsequent hierarchical structures classified from another viewpoint are determined by determining the hierarchical structure obtained by executing Can be generated, like Achieved viewpoint from one old hierarchical structure are mixed, the effect of a plurality of hierarchical structure classified by different viewpoint can be easily generated automatically.
本願に開示する階層構造管理装置は、前記第n階層構造決定手段が、前記任意の一の重複単語を、前記他の新階層構造における各ノードの名称を構成する単語集合に追加したものを単語集合として、前記再構成手段の処理を順次実行した場合に、実行した結果再構成された階層構造に、前記追加した任意の一の重複単語が1回しか出現しない前記他の新階層構造が複数あるときは、当該複数の他の新階層構造における各根ノードに対応付けられるファイルの数を比較し、当該ファイルの数が最小となる前記他の新階層構造に、前記任意の一の重複単語を追加して得られた対応情報を新階層構造として決定するものである。 In the hierarchical structure management device disclosed in the present application, the n-th hierarchical structure determination unit adds the arbitrary one duplicate word to a word set that constitutes the name of each node in the other new hierarchical structure. When the processing of the reconfiguring means is sequentially executed as a set, there are a plurality of other new hierarchical structures in which the added one duplicate word appears only once in the hierarchical structure reconfigured as a result of execution. When there is, the number of files associated with each root node in the plurality of other new hierarchical structures is compared, and the one new overlapping word is added to the other new hierarchical structure in which the number of the files is minimized. The correspondence information obtained by adding is determined as a new hierarchical structure.
このように、本願に開示する階層構造管理装置においては、任意の一の重複単語を、新階層構造における各ノードの名称を構成する単語集合に追加したものを単語集合として、再構成手段の処理を順次実行した場合に、任意の一の重複単語が1回しか出現しない新階層構造が複数あるときは、その複数の新階層構造における各根ノードに対応付けられるファイルの数を比較し、そのファイルの数が最小となる新階層構造に、任意の一の重複単語を追加して得られた対応情報を新階層構造として決定するため、任意の一の重複単語が分類される候補となる新階層構造が複数あったとしても、根ノードに対応付けられたファイル数が少なく、効率よく整理された新階層構造に分類することで、分類の精度を上げてファイルの管理を正確に行うことができるという効果を奏する。 As described above, in the hierarchical structure management device disclosed in the present application, processing of the reconstruction means is performed by using any one duplicate word added to the word set constituting the name of each node in the new hierarchical structure as a word set. When there are multiple new hierarchical structures in which any one duplicate word appears only once, the number of files associated with each root node in the multiple new hierarchical structures is compared, and Since the correspondence information obtained by adding any one duplicate word to the new hierarchy structure with the smallest number of files is determined as the new hierarchy structure, a new candidate that can be classified as any one duplicate word is determined. Even if there are multiple hierarchies, the number of files associated with the root node is small, and the new hierarchies are efficiently organized to improve the accuracy of classification and manage files accurately. An effect that can be.
本願に開示する階層構造管理装置は、前記第n階層構造決定手段が、前記複数の他の新階層構造における根ノードに対応付けられるファイルの数を比較した場合に、最小となるファイル数が同じとなる前記他の新階層構造が複数あるときには、前記追加された重複単語を保留単語として記憶し、当該保留単語となった重複単語以外の他の重複単語について、前記再構成手段の処理が終わった後に、再度保留単語について前記再構成手段の処理を実行して得られた対応情報を新階層構造として決定するものである。 In the hierarchical structure management device disclosed in the present application, when the n-th hierarchical structure determining unit compares the number of files associated with root nodes in the plurality of other new hierarchical structures, the minimum number of files is the same. When there are a plurality of other new hierarchical structures, the added duplicate word is stored as a reserved word, and the processing of the reconstructing means is completed for other duplicate words other than the duplicate word that has become the reserved word. After that, the correspondence information obtained by executing the processing of the reconstructing means for the reserved word again is determined as a new hierarchical structure.
このように、本願に開示する階層構造管理装置においては、複数の新階層構造における根ノードに対応付けられるファイルの数を比較した場合に、最小となるファイル数が同じとなる新階層構造が複数あるときには、追加された重複単語を保留単語として記憶し、保留単語となった重複単語以外の他の重複単語について、再構成手段の処理が終わった後に、再度保留単語について再構成手段の処理を実行して得られた対応情報を新階層構造として決定するため、一旦保留単語として他の重複単語について再構成手段の処理を実行することで、新階層構造の構成が変更されており、保留単語について再度再構成手段の処理を実行した場合には、任意の一の新階層構造に分類することができる可能性があるため、新階層構造を正確に分類して生成することができるという効果を奏する。 Thus, in the hierarchical structure management device disclosed in the present application, when comparing the number of files associated with the root node in a plurality of new hierarchical structures, there are a plurality of new hierarchical structures with the same minimum number of files. In some cases, the added duplicate word is stored as a reserved word, and the process of the reconstruction means is performed again for the reserved word after the process of the reconstruction means is finished for other duplicate words other than the duplicate word that has become the reserved word. In order to determine the correspondence information obtained by execution as a new hierarchical structure, the structure of the new hierarchical structure has been changed by executing the processing of the reconstruction means for other duplicate words once as a reserved word. If the processing of the reconstruction means is executed again for, there is a possibility that it can be classified into any one new hierarchical structure, so the new hierarchical structure is correctly classified and generated There is an effect that it is Rukoto.
本願に開示する階層構造管理装置は、前記第1階層構造決定手段が決定した第1の新階層構造、及び前記第n階層構造決定手段が決定した一又は複数の新階層構造を表示する表示制御手段と、前記第1の新階層構造及び他の新階層構造における全てのノードの名称を構成する単語のうち、任意の一又は複数の単語からなる対象単語について、当該対象単語が含まれる新階層構造以外の各候補新階層構造に対して、当該候補新階層構造におけるノードの名称を構成する単語に前記対象単語を追加したものを単語集合として前記再構成手段の処理を順次実行し、実行した結果、再構成後に前記対象単語が1回しか出現しない候補新階層構造がある場合に、当該対象単語を抽出する対象単語抽出手段とを備え、前記表示制御手段が、前記対象単語抽出手段で抽出した対象単語について、他の単語との表示態様を異ならせて表示するものである。 The hierarchical structure management device disclosed in the present application is a display control for displaying the first new hierarchical structure determined by the first hierarchical structure determining means and one or more new hierarchical structures determined by the nth hierarchical structure determining means. And a new hierarchy in which the target word is included for a target word composed of any one or a plurality of words among words constituting the names of all nodes in the first new hierarchical structure and the other new hierarchical structure For each candidate new hierarchical structure other than the structure, the processing of the reconstruction means was sequentially executed by adding the target word to the word constituting the name of the node in the candidate new hierarchical structure as a word set. As a result, when there is a candidate new hierarchical structure in which the target word appears only once after reconstruction, target word extraction means is provided for extracting the target word, and the display control means is configured to extract the target word. For target words extracted in unit, and displays with different display modes of the other words.
このように、本願に開示する階層構造管理装置においては、新階層構造を表示し、全てのノードの名称を構成する単語のうち、任意の一又は複数の単語からなる対象単語について、対象単語が含まれない候補新階層構造ごとに、候補新階層構造におけるノードの名称
を構成する単語に対象単語を追加したものを単語集合として再構成手段の処理を順次実行し、実行した結果、再構成後に対象単語が1回しか出現しない候補新階層構造がある場合に、その対象単語を抽出し、他の単語と表示態様を異ならせて表示するため、対象単語について、その単語を現在分類されている新階層構造から他の新階層構造に分類することが可能であることを視覚的に認識することができ、利用者の使い勝手を向上させることができるという効果を奏する。
As described above, in the hierarchical structure management device disclosed in the present application, the new hierarchical structure is displayed, and among the words constituting the names of all the nodes, the target word is the target word including any one or a plurality of words. For each candidate new hierarchical structure that is not included, the processing of the reconstruction means is sequentially executed as a word set by adding the target word to the word that constitutes the name of the node in the candidate new hierarchical structure, and as a result of the reconstruction, When there is a candidate new hierarchical structure in which the target word appears only once, the target word is extracted and displayed differently from other words, so that the word is currently classified for the target word It is possible to visually recognize that it is possible to classify from the new hierarchical structure to another new hierarchical structure, and the user-friendliness can be improved.
本願に開示する階層構造管理装置は、前記表示制御手段が、前記対象単語が1回しか出現しない候補新階層構造を示す情報を、前記対象単語と対応付けて表示するものである。 In the hierarchical structure management device disclosed in the present application, the display control means displays information indicating a candidate new hierarchical structure in which the target word appears only once in association with the target word.
このように、本願に開示する階層構造管理装置においては、対象単語が1回しか出現しない候補新階層構造を示す情報を、対象単語と対応付けて表示するため、対象単語について、その単語を現在分類されている新階層構造から他の新階層構造に分類することが可能であることを視覚的に認識することができると共に、その可能な分類先も併せて表示して利用者の使い勝手をより向上させることができるという効果を奏する。 As described above, in the hierarchical structure management device disclosed in the present application, the information indicating the candidate new hierarchical structure in which the target word appears only once is displayed in association with the target word. It is possible to visually recognize that it is possible to classify from the new hierarchical structure that has been classified into another new hierarchical structure, and display the possible classification destinations together to further improve the user-friendliness. There is an effect that it can be improved.
本願に開示する階層構造管理装置は、前記第1階層構造決定手段が決定した第1の新階層構造、及び前記第n階層構造決定手段が決定した一又は複数の新階層構造を表示する表示制御手段を備え、前記表示制御手段が、前記新階層構造において、同一の単語が同一の階層構造に出現している場合に、当該同一の単語を他の単語と区別して表示するものである。 The hierarchical structure management device disclosed in the present application is a display control for displaying the first new hierarchical structure determined by the first hierarchical structure determining means and one or more new hierarchical structures determined by the nth hierarchical structure determining means. Means for displaying the same word in distinction from other words when the same word appears in the same hierarchical structure in the new hierarchical structure.
このように、本願に開示する階層構造管理装置においては、新階層構造を表示し、同一の単語が同一の階層構造に出現している場合に、その同一の単語を他の単語と区別して表示するため、分類が正確になされずに同一の階層構造に重複して分類された単語があったとしても、それを視覚的に表示して利用者が容易に認識することができるという効果を奏する。 In this way, in the hierarchical structure management device disclosed in the present application, a new hierarchical structure is displayed, and when the same word appears in the same hierarchical structure, the same word is displayed separately from other words. Therefore, even if there is a word classified in the same hierarchical structure without being classified correctly, it is possible to visually display the word and easily recognize it. .
本願に開示する階層構造管理装置は、前記第1階層構造決定手段が決定した第1の新階層構造、及び前記第n階層構造決定手段が決定した一又は複数の新階層構造を表示する表示制御手段と、前記表示された任意の一の新階層構造のノードの名称を構成する任意の一又は複数の単語からなる指定単語、及び当該指定単語を移動させる移動先新階層構造とが指定された場合に、前記移動先新階層構造を構成する単語に、前記指定単語を追加したものを単語集合として前記再構成手段の処理を実行すると共に、前記指定単語が含まれる新階層構造におけるノードの名称を構成する単語から、前記指定単語を除外したものを単語集合として前記再構成手段の処理を実行して、新階層構造間の単語の移動を制御する移動制御手段とを備えるものである。 The hierarchical structure management device disclosed in the present application is a display control for displaying the first new hierarchical structure determined by the first hierarchical structure determining means and one or more new hierarchical structures determined by the nth hierarchical structure determining means. Means, a designated word consisting of any one or a plurality of words constituting the name of the node of any one of the displayed new hierarchical structures, and a destination new hierarchical structure for moving the designated words are designated In this case, the processing of the reconfiguring unit is executed by adding the designated word to the words constituting the new destination hierarchical structure as a word set, and the name of the node in the new hierarchical structure including the designated word And a movement control means for controlling the movement of the words between the new hierarchical structures by executing the processing of the reconstruction means as a set of words excluding the designated word from the words constituting
このように、本願に開示する階層構造管理装置においては、新階層構造を表示し、表示された任意の一の新階層構造のノードの名称を構成する任意の一又は複数の単語からなる指定単語と、その指定単語を移動させる移動先新階層構造とが指定された場合に、移動先新階層構造を構成する単語に、指定単語を追加したものを単語集合として再構成手段の処理を実行すると共に、指定単語が含まれる新階層構造におけるノードの名称を構成する単語から、指定単語を除外したものを単語集合として再構成手段の処理を実行して、新階層構造間の単語の移動を制御するため、ノードの名称を構成する単語を現在分類されている階層構造から他の階層構造に移動して新たに階層構造を構築することができるため、高水準な操作により正確な階層構造を構築することができるという効果を奏する。 As described above, in the hierarchical structure management device disclosed in the present application, a specified word composed of any one or a plurality of words that displays a new hierarchical structure and constitutes the name of a node of any one displayed new hierarchical structure. And the new destination hierarchical structure to which the designated word is to be moved, the processing of the reconstruction means is executed by using the word constituting the new destination hierarchical structure plus the designated word as a word set. At the same time, the word structure between the new hierarchical structures is controlled by executing the processing of the reconstruction means as a set of words that excludes the specified words from the words constituting the node names in the new hierarchical structure including the specified words. Therefore, it is possible to move a word constituting the node name from the currently classified hierarchical structure to another hierarchical structure, and to construct a new hierarchical structure. An effect that can be constructed.
本願に開示する階層構造管理装置は、前記第1階層構造決定手段が決定した第1の新階層構造、及び前記第n階層構造決定手段が決定した一又は複数の新階層構造を表示する表
示制御手段と、前記表示された任意の一の新階層構造のノードの名称を構成する任意の一又は複数の単語からなる指定単語、及び当該指定単語を削除する削除指示情報が入力された場合に、前記入力された指定単語が含まれる新階層構造におけるノードの名称を構成する単語から、前記指定単語を除外したものを単語集合として前記再構成手段の処理を実行し、新階層構造からの単語の削除を制御する削除制御手段とを備えるものである。
The hierarchical structure management device disclosed in the present application is a display control for displaying the first new hierarchical structure determined by the first hierarchical structure determining means and one or more new hierarchical structures determined by the nth hierarchical structure determining means. Means and a designated word consisting of any one or more words constituting the name of any one of the displayed new hierarchical structure nodes, and deletion instruction information for deleting the designated word, The processing of the reconstructing means is performed by using the word constituting the name of the node in the new hierarchical structure including the inputted designated word, excluding the designated word as a word set, and the word from the new hierarchical structure Deletion control means for controlling deletion.
このように、本願に開示する階層構造管理装置においては、新階層構造を表示し、表示された任意の一の新階層構造のノードの名称を構成する任意の一又は複数の単語からなる指定単語、及び指定単語を削除する削除指示情報が入力された場合に、入力された指定単語が含まれる新階層構造におけるノードの名称を構成する単語から、指定単語を除外したものを単語集合として再構成手段の処理を実行し、新階層構造からの単語の削除を制御するため、不要な単語を削除して、高水準な操作により正確な階層構造を構築することができるという効果を奏する。 As described above, in the hierarchical structure management device disclosed in the present application, a specified word composed of any one or a plurality of words that displays a new hierarchical structure and constitutes the name of a node of any one displayed new hierarchical structure. When the delete instruction information for deleting the specified word is input, the word constituting the node name in the new hierarchical structure including the input specified word is reconfigured as a word set. Since the processing of the means is executed and the deletion of words from the new hierarchical structure is controlled, an unnecessary hierarchical word can be deleted and an accurate hierarchical structure can be constructed by a high-level operation.
本願に開示する階層構造管理装置は、前記第1階層構造決定手段が決定した第1の新階層構造、及び前記第n階層構造決定手段が決定した一又は複数の新階層構造を表示する表示制御手段と、前記表示された新階層構造のノードの名称を構成する単語が複数指定され、当該指定された指定単語を同義語とする指示情報が入力された場合に、前記指定単語を任意の一の単語に統一、又は前記指定単語を示す情報を一の情報に統一して、前記再構成手段の処理を実行し、同義語の制御を行う同義語制御手段とを備えるものである。 The hierarchical structure management device disclosed in the present application is a display control for displaying the first new hierarchical structure determined by the first hierarchical structure determining means and one or more new hierarchical structures determined by the nth hierarchical structure determining means. And a plurality of words constituting the names of the displayed nodes of the new hierarchical structure are designated, and when the instruction information having the designated designated word as a synonym is input, the designated word is arbitrarily selected. Or synonym control means for controlling the synonyms by executing the processing of the reconstruction means by unifying information indicating the designated word into one information.
このように、本願に開示する階層構造管理装置においては、新階層構造を表示し、表示された新階層構造のノードの名称を構成する単語が複数指定され、指定された指定単語を同義語とする指示情報が入力された場合に、指定単語を任意の一の単語に統一、又は指定単語を示す情報を一の情報に統一して、再構成手段の処理を実行し、同義語の制御を行うため、異なる単語であっても同じ意味である単語(例えば、西暦2010年と平成22年等)については、同一の単語として処理することができ、階層構造を正確に構築しつつ簡素化することができるという効果を奏する。 As described above, in the hierarchical structure management device disclosed in the present application, a new hierarchical structure is displayed, a plurality of words constituting the name of the displayed node of the new hierarchical structure are designated, and the designated designated word is defined as a synonym. When the instruction information to be input is input, the designated word is unified into one arbitrary word, or the information indicating the designated word is unified into one information, the processing of the reconstruction means is executed, and the synonym control is performed. Therefore, even if different words have the same meaning (for example, 2010 and 2010), they can be processed as the same word, and the hierarchical structure is accurately constructed and simplified. There is an effect that can be.
本願に開示する階層構造管理装置は、前記管理ファイルの名称、及び前記旧階層構造における各ノードの名称を形態素解析により分割して単語情報を作成し、当該単語情報における各単語に、当該単語を示す単語IDを割り振る単語情報生成手段と、前記旧対応情報記憶手段に記憶された対応情報を表示する旧対応情報表示制御手段と、前記表示された対応情報における階層構造のノードの名称を構成する単語のうち、同一名称の単語が複数指定されると共に、当該指定された名称の単語が異なる意味を持つ単語であることを示す情報が入力された場合に、前記指定された同一名称の単語の各単語IDを異ならせて多義語の制御を行う多義語制御手段とを備えるものである。 The hierarchical structure management device disclosed in the present application creates word information by dividing the name of the management file and the name of each node in the old hierarchical structure by morphological analysis, and assigns the word to each word in the word information. A word information generating means for assigning a word ID to be indicated; an old correspondence information display control means for displaying the correspondence information stored in the old correspondence information storage means; and names of nodes in a hierarchical structure in the displayed correspondence information. Among the words, when a plurality of words having the same name are designated and information indicating that the designated name is a word having a different meaning is input, And a polysemy control means for controlling polysemy with different word IDs.
このように、本願に開示する階層構造管理装置においては、管理ファイルの名称、及び旧階層構造における各ノードの名称を形態素解析により分割して単語情報を作成し、作成した単語情報における各単語に、単語を示す単語IDを割り振り、旧対応情報記憶手段に記憶された対応情報(旧階層構造)を表示し、表示された対応情報における階層構造のノードの名称を構成する単語のうち、同一名称の単語が複数指定されると共に、指定された名称の単語が異なる意味を持つ単語であることを示す情報が入力された場合に、指定された同一名称の単語の各単語IDを異ならせて多義語の制御を行うため、同一の単語であっても異なる意味を持つ単語(例えば、別人の「鈴木」姓等)については、別単語として処理することができ、階層構造を正確に構築することができるという効果を奏する。 Thus, in the hierarchical structure management device disclosed in the present application, the name of the management file and the name of each node in the old hierarchical structure are divided by morphological analysis to create word information, and each word in the created word information is assigned to each word. , Assigning a word ID indicating a word, displaying the correspondence information (old hierarchical structure) stored in the old correspondence information storage means, and the same name among the words constituting the name of the node of the hierarchical structure in the displayed correspondence information When a plurality of words are specified and information indicating that the word with the specified name is a word having a different meaning is input, each word ID of the specified word with the same name is made different to make it ambiguous Because words are controlled, words that have different meanings even if they are the same word (for example, another person's “Suzuki” surname) can be processed as different words, and the hierarchical structure An effect that can be constructed to Make.
本願に開示する階層構造管理装置は、複数の階層構造をそれぞれ異なる分類基準で形成し、当該形成された各階層構造ごとに前記全ての管理ファイルについて、当該管理ファイ
ルと前記各階層構造におけるノードとの対応情報を記憶する対応情報記憶手段と、前記対応情報記憶手段が記憶する各階層構造を表示する表示制御手段と、前記対応情報記憶手段が記憶する前記対応情報における全てのノードの名称を構成する単語のうち、任意の一又は複数の単語からなる対象単語について、当該対象単語が含まれる階層構造以外の各候補新階層構造に対して、当該候補新階層構造におけるノードの名称を構成する単語に前記対象単語を追加したものを単語集合として前記再構成手段の処理を順次実行し、実行した結果、再構成後に前記対象単語が1回しか出現しない候補新階層構造がある場合に、当該対象単語を抽出する対象単語抽出手段とを備え、前記表示制御手段が、前記対象単語抽出手段で抽出した対象単語について、他の単語との表示態様を異ならせて表示するものである。
The hierarchical structure management device disclosed in the present application forms a plurality of hierarchical structures according to different classification standards, and for each of the formed hierarchical structures, for all the management files, the management file and the nodes in the hierarchical structures The correspondence information storage means for storing the correspondence information, the display control means for displaying each hierarchical structure stored in the correspondence information storage means, and the names of all nodes in the correspondence information stored in the correspondence information storage means Words constituting the names of nodes in the candidate new hierarchical structure with respect to each candidate new hierarchical structure other than the hierarchical structure including the target word with respect to a target word composed of any one or a plurality of words The processing of the reconstructing means is sequentially executed by adding the target word to the word set as a word set, and as a result of the execution, the target word is A target word extraction unit that extracts the target word when there is a candidate new hierarchical structure that appears only once, and the display control unit determines whether the target word extracted by the target word extraction unit The display mode is displayed differently.
以下、本発明の実施の形態を説明する。本発明は多くの異なる形態で実施可能である。従って、本実施形態の記載内容のみで本発明を解釈すべきではない。また、本実施形態の全体を通して同じ要素には同じ符号を付けている。 Embodiments of the present invention will be described below. The present invention can be implemented in many different forms. Therefore, the present invention should not be construed based only on the description of the present embodiment. Also, the same reference numerals are given to the same elements throughout the present embodiment.
以下の実施の形態では、主に装置について説明するが、所謂当業者であれば明らかな通り、本発明は方法、及び、コンピュータを動作させるためのプログラムとしても実施できる。また、本発明はハードウェア、ソフトウェア、または、ハードウェア及びソフトウェアの実施形態で実施可能である。プログラムは、ハードディスク、CD−ROM、DVD−ROM、光記憶装置、または、磁気記憶装置等の任意のコンピュータ可読媒体に記録できる。さらに、プログラムはネットワークを介した他のコンピュータに記録することができる。 In the following embodiments, the apparatus will be mainly described. However, as is apparent to those skilled in the art, the present invention can also be implemented as a method and a program for operating a computer. In addition, the present invention can be implemented in hardware, software, or hardware and software embodiments. The program can be recorded on any computer-readable medium such as a hard disk, CD-ROM, DVD-ROM, optical storage device, or magnetic storage device. Furthermore, the program can be recorded on another computer via a network.
(本発明の第1の実施形態)
本実施形態に係る階層構造管理装置について、図1ないし図19を用いて説明する。本実施形態に係る階層構造管理装置は、コンピュータに既存の階層構造(旧階層構造とする)で格納されている複数のファイルを自動分類し、互いに独立した複数の階層構造(新階層構造とする)及び新階層構造とファイルとの対応情報を自動生成する。
(First embodiment of the present invention)
A hierarchical structure management apparatus according to the present embodiment will be described with reference to FIGS. The hierarchical structure management apparatus according to the present embodiment automatically classifies a plurality of files stored in an existing hierarchical structure (old hierarchical structure) in a computer, and sets a plurality of independent hierarchical structures (new hierarchical structure). ) And new hierarchy structure and file correspondence information is automatically generated.
既存のファイルのパス名一覧を入力データとし、ノード名やファイル名を形態素解析して単語情報を構築する。既存のファイルを保持している旧階層構造から、複数箇所に出現する単語を切り出して旧階層構造を単純化する。この時点で、第1の新階層構造が形成される。その後、切り出した単語を使用して第2以降の新階層構造を構築する。その際に、各単語が新階層構造上の複数の箇所に出現しないように、それぞれの単語が所属する新階層構造を決定する。具体的には、各単語にカテゴリIDが付与され、そのカテゴリIDが同一の単語で1つの新階層構造を形成する。これと並行して、ファイルと新階層構造との対応関係は、ファイルと旧階層構造との対応関係に基づいて自動で決定される。 A list of path names of existing files is used as input data, and word information is constructed by morphological analysis of node names and file names. The old hierarchical structure is simplified by cutting out words appearing at a plurality of places from the old hierarchical structure holding the existing file. At this point, the first new hierarchical structure is formed. Thereafter, second and subsequent new hierarchical structures are constructed using the extracted words. At that time, a new hierarchical structure to which each word belongs is determined so that each word does not appear at a plurality of locations on the new hierarchical structure. Specifically, a category ID is assigned to each word, and one new hierarchical structure is formed with words having the same category ID. In parallel with this, the correspondence between the file and the new hierarchical structure is automatically determined based on the correspondence between the file and the old hierarchical structure.
既存ファイルのパス名には、それを作成した組織で使用されるファイルの分類基準がほぼ完全な形で含まれていることが期待される。本実施形態に係る階層構造管理装置を用いることで、これらの分類基準を独立した新階層構造を用いて再構成することができる。一般的な組織では、業務とファイルが密接に関連しているため、再構成された多次元ツリーは組織の業務実態に即したものとなり、業務フローの見直しや組織改革の際にも役立つことが期待される。 It is expected that existing file pathnames will contain almost complete classification criteria for the files used by the organization that created them. By using the hierarchical structure management apparatus according to the present embodiment, these classification criteria can be reconfigured using an independent new hierarchical structure. In general organizations, the business and files are closely related, so the reconstructed multidimensional tree is in line with the actual business of the organization and can be useful for reviewing the business flow and organizational reform. Be expected.
図1は、本実施形態に係る階層構造管理装置のハードウェア構成図である。階層構造管理装置1は、CPU11、RAM12、ROM13、ハードディスク(HDとする)14、通信I/F15、及び入出力I/F16を備える。ROM13やHD14には、オペレーティングシステムや各種プログラム(例えば、階層構造管理プログラム等)が格納されており、必要に応じてRAM12に読み出され、CPU11により各プログラムが実行される。通信I/F15は、他の装置(例えば、ファイルサーバであればクライアント端末等)と通信を行うためのインタフェースである。入出力I/F16は、キーボードやマウス等の入力機器からの入力を受け付けたり、プリンタやディスプレイ等にデータを出力するためのインタフェースである。この入出力I/F16としてUSBやRS232C等が用いられる。また、必要に応じて、光磁気ディスク、フロッピーディスク(登録商標)、CD−R、DVD−R等のリムーバブルディスクに対応したドライブを接続することができる。 FIG. 1 is a hardware configuration diagram of the hierarchical structure management apparatus according to the present embodiment. The hierarchical structure management apparatus 1 includes a CPU 11, a RAM 12, a ROM 13, a hard disk (HD) 14, a communication I / F 15, and an input / output I / F 16. The ROM 13 and the HD 14 store an operating system and various programs (for example, a hierarchical structure management program). The ROM 13 and the HD 14 are read into the RAM 12 as necessary, and are executed by the CPU 11. The communication I / F 15 is an interface for communicating with other devices (for example, a client terminal in the case of a file server). The input / output I / F 16 is an interface for receiving input from an input device such as a keyboard and a mouse, and outputting data to a printer, a display, or the like. USB, RS232C, or the like is used as the input / output I / F 16. Further, if necessary, a drive corresponding to a removable disk such as a magneto-optical disk, a floppy disk (registered trademark), a CD-R, or a DVD-R can be connected.
図2は、本実施形態に係る階層構造管理装置の機能ブロック図である。階層構造管理装置1は、再構成処理部21と単語情報生成部22と第1階層構造生成部23と第n階層構造生成部24と対応情報生成部25と表示制御部26と管理ファイル27と対応情報部28と表示画面29とを備える。 FIG. 2 is a functional block diagram of the hierarchical structure management apparatus according to the present embodiment. The hierarchical structure management apparatus 1 includes a reconstruction processing unit 21, a word information generation unit 22, a first hierarchical structure generation unit 23, an nth hierarchical structure generation unit 24, a correspondence information generation unit 25, a display control unit 26, a management file 27, A correspondence information unit 28 and a display screen 29 are provided.
再構成処理部21は、任意の一又は複数の単語集合が入力された場合に、対応情報28に記憶されている旧階層構造におけるノードの名称から、入力された単語集合に含まれない単語を削除して、入力された単語集合のみを含む階層構造及び階層構造とファイルとの対応関係を生成する。単語が削除された結果名称が空になった空ノードについては、その空ノードを削除し、共通の親を有する兄弟関係のノードの中で、同一の名称となったノードを統合して対応情報28を再構成する。空ノードを削除する場合は、空ノードの子ノード及び葉ノードについては直近の先祖ノードに対応付ける。この再構成処理については、図3ないし図7を用いて詳細を後述する。 When any one or a plurality of word sets are input, the reconstruction processing unit 21 selects words that are not included in the input word set from the names of the nodes in the old hierarchical structure stored in the correspondence information 28. By deleting, a hierarchical structure including only the input word set and a correspondence between the hierarchical structure and the file are generated. As for the empty node whose name is empty as a result of the deletion of the word, the empty node is deleted, and the nodes with the same name among the sibling nodes that have a common parent are integrated. 28 is reconfigured. When deleting an empty node, the child node and leaf node of the empty node are associated with the nearest ancestor node. Details of this reconstruction processing will be described later with reference to FIGS.
単語情報生成部22は、管理ファイル27の名称、及び対応情報28で対応付けられた旧階層構造における各ノードの名称を入力とし、形態素解析や類似後判定処理を用いて単語情報を作成する。単語情報は単語を要素とする一次元配列であり、その要素数は単語数と一致する。また、一次元配列の要素は、単語、単語ID、カテゴリIDの3つのフィールドを持つ構造体である。この単語情報生成処理については、図9及び図10を用いて詳細を後述する。 The word information generation unit 22 receives the name of the management file 27 and the name of each node in the old hierarchical structure associated with the correspondence information 28, and creates word information using morphological analysis and post-similarity determination processing. The word information is a one-dimensional array having words as elements, and the number of elements matches the number of words. The element of the one-dimensional array is a structure having three fields of word, word ID, and category ID. Details of the word information generation processing will be described later with reference to FIGS. 9 and 10.
第1階層構造生成部23は、対応情報28で対応付けられた階層構造における全てのノードに関する単語情報を入力とし、階層レベルごとに、ノードの名称に重複して出現する重複単語を抽出すると共に、重複単語が抽出された場合に、単語情報のうち重複単語以外の単語集合について、再構成処理を実行し、全ての階層レベルについて重複単語の抽出、及び再構成処理が実行された後に最終的に残ったノードとファイルとの対応情報を第1の新階層構造として決定する。この第1の新階層構造生成処理については、図11ないし図14を用いて詳細を後述する。 The first hierarchical structure generation unit 23 receives word information relating to all nodes in the hierarchical structure associated with the correspondence information 28 as input, and extracts duplicate words that appear redundantly in the node names for each hierarchical level. When a duplicate word is extracted, a reconstruction process is executed for a word set other than the duplicate word in the word information, and finally, after the duplicate word extraction and the reconstruction process are executed for all hierarchical levels. The correspondence information between the remaining nodes and files is determined as the first new hierarchical structure. The details of the first new hierarchical structure generation process will be described later with reference to FIGS.
第n階層構造生成部24は、第1階層構造生成部23で抽出された重複単語を入力とし、各重複単語をカテゴリ(複数の新階層構造)に分類する。その際に、カテゴリを構成する新階層構造において、同一の単語が複数回出現しないようにする。すなわち、新階層構造における各ノードの名称を構成する単語集合に、その新階層構造ごとに任意の一の重複単語を追加したものを単語集合として再構成処理を順次実行し、実行した結果再構成された階層構造に、追加した任意の一の重複単語が1回しか出現しない場合には、そのカテゴリに分類し、追加した任意の一の重複単語が複数回出現する場合には、任意の一の重複単
語を新たなカテゴリに分類する。カテゴリに分類されることで、そのカテゴリに基づいて新階層構造の対応情報が生成される。
The n-th hierarchical structure generation unit 24 receives the duplicate words extracted by the first hierarchical structure generation unit 23 as input, and classifies each duplicate word into a category (a plurality of new hierarchical structures). At that time, the same word is prevented from appearing more than once in the new hierarchical structure constituting the category. In other words, the word set that constitutes the name of each node in the new hierarchical structure is added with any one duplicate word for each new hierarchical structure, and the reconstruction process is sequentially executed as a word set, and the result is reconstructed. If any one added duplicate word appears in the hierarchical structure once, it is classified into that category, and if any one added duplicate word appears multiple times, any one Are classified into a new category. By being classified into categories, correspondence information of a new hierarchical structure is generated based on the categories.
対応情報生成部25は、ファイルやノードの追加、削除、移動等の操作が行われた場合に、その操作情報に対応して対応情報部28の対応情報を生成する。
表示制御部26は、旧階層構造や新階層構造を対応情報部28の対応情報に基づいて表示画面29に表示する。
When an operation such as addition, deletion, or movement of a file or a node is performed, the correspondence information generation unit 25 generates correspondence information of the correspondence information unit 28 corresponding to the operation information.
The display control unit 26 displays the old hierarchical structure and the new hierarchical structure on the display screen 29 based on the correspondence information in the correspondence information unit 28.
管理ファイル27は、コンピュータ内で管理されている全てのファイルを記憶する。
対応情報部28は、旧階層構造や新階層構造におけるノード間、ノードとファイルとの間等の対応関係を示す対応情報を記憶する。なお、単語情報生成部22で生成された単語情報もこの対応情報部28に含むようにしてもよい。
The management file 27 stores all files managed in the computer.
The correspondence information unit 28 stores correspondence information indicating correspondence relationships between nodes in the old hierarchical structure and the new hierarchical structure, and between nodes and files. The word information generated by the word information generating unit 22 may also be included in the correspondence information unit 28.
なお、単語情報生成部22、第1階層構造生成部23、及び第n階層構造生成部24については、必須の構成要素ではなく、必要に応じて備えられる構成であってもよい。 Note that the word information generation unit 22, the first hierarchical structure generation unit 23, and the nth hierarchical structure generation unit 24 are not essential components, and may be configured as necessary.
次に、各処理部の動作について説明する。図3は、本実施形態に係る階層構造管理装置における再構成処理部の動作を示すフローチャートである。まず、旧階層構造の対応情報をコピーして、作業用の階層構造を作る(S31)。以降は、この作業用の階層構造に対して処理を実行する。図4は、旧階層構造の一例である。図4の階層構造について、以降の処理を具体的に説明する。 Next, the operation of each processing unit will be described. FIG. 3 is a flowchart showing the operation of the reconstruction processing unit in the hierarchical structure management apparatus according to the present embodiment. First, the correspondence information of the old hierarchical structure is copied to create a working hierarchical structure (S31). Thereafter, the process is executed on the hierarchical structure for work. FIG. 4 is an example of the old hierarchical structure. The following processing will be specifically described with respect to the hierarchical structure of FIG.
再構成処理部21に対して任意の単語集合を入力し(S31)、その単語集合に含まれない単語を作業用の階層構造から削除する(S32)。ここでは、仮に{教育、研究、渡辺、鈴木、佐藤、2008}が単語集合として入力されたものとすると、単語集合に含まれていない図5の着色されたノードが削除されて、図6に示す階層構造が形成される。 An arbitrary word set is input to the reconstruction processing unit 21 (S31), and words not included in the word set are deleted from the working hierarchical structure (S32). Here, if {Education, Research, Watanabe, Suzuki, Sato, 2008} is input as a word set, the colored nodes in FIG. 5 that are not included in the word set are deleted, and FIG. The hierarchical structure shown is formed.
なお、削除される単語とノードの名称とは必ずしも完全一致している必要はなく、ノードの名称の一部に、削除される単語が含まれるものであってもよい。その場合は、ノードの名称全てが削除されるのではなく、名称の中の単語のみが削除されるようにしてもよい。 It should be noted that the deleted word and the node name do not necessarily match completely, and the deleted word may be included in a part of the node name. In that case, not all the names of the nodes may be deleted, but only the words in the names may be deleted.
作業用の階層構造の根ノードからの距離が近い順に、各ノードごとに順次以下の処理を行う。処理対象となっている各ノードを対象ノードとし、対象ノードの名称を構成する単語又は単語の集合(名称が複数の単語で構成されている場合)が、対象ノードと共通の親を有する兄弟ノードの名称を構成する単語又は単語の集合と一致した場合に、対象ノードと兄弟ノードとを統合する(S34)。このとき、当該対象ノードの子ノードや、対象ノードと統合する兄弟ノードの子ノードは、いずれも統合したノードの子ノードとする。単語が削除されることで、対象ノードの名称が空になったもの(対象ノードの名称に単語を含まないもの)となった場合は、対象ノードを削除すると共に(S35)、対象ノードの子ノード及び葉ノードを対象ノードの直近の先祖ノード(例えば、親ノード)に直接対応付ける。対象ノードの削除によって、新たに兄弟ノードとなったノードについても、同様に統合の対象とする。 The following processing is sequentially performed for each node in order of increasing distance from the root node of the working hierarchical structure. A sibling node in which each node to be processed is a target node, and a word or a set of words constituting the name of the target node (when the name is composed of a plurality of words) has a common parent with the target node When the word or the word set constituting the name matches, the target node and the sibling node are integrated (S34). At this time, a child node of the target node and a child node of a sibling node integrated with the target node are all child nodes of the integrated node. If the name of the target node becomes empty due to the deletion of the word (the name of the target node does not include a word), the target node is deleted (S35) and the child of the target node The node and the leaf node are directly associated with the nearest ancestor node (for example, the parent node) of the target node. Similarly, a node that becomes a new sibling node by deleting the target node is also subject to integration.
上記処理の結果生成された階層構造を図7に示す。入力された単語集合に含まれる単語のみで形成された階層構造が、簡素化された形で新たに生成され、ノード間の対応関係やファイルとノードとの対応関係も、旧階層構造における対応関係(図4の階層構造)と矛盾することなく生成される。 The hierarchical structure generated as a result of the above processing is shown in FIG. A hierarchical structure formed only of words included in the input word set is newly generated in a simplified form, and correspondence between nodes and correspondence between files and nodes are also correspondences in the old hierarchical structure. It is generated without contradicting (hierarchical structure in FIG. 4).
すなわち、再構成処理部21の処理により、入力された任意の一又は複数の単語集合を
観点とした新たな階層構造を生成することができ、利用者が既存の旧階層構造から、任意の観点に基づく新たな階層構造をカスタマイズして生成し、使い勝手がよいものになる。
That is, the processing of the reconstruction processing unit 21 can generate a new hierarchical structure in view of any one or a plurality of input word sets, and the user can select an arbitrary viewpoint from the existing old hierarchical structure. Customize and generate a new hierarchical structure based on, making it easy to use.
図8は、本実施形態に係る階層構造管理装置の全体の処理を示すフローチャートである。まず、単語情報生成部22が単語情報生成処理を行う(S81)。この単語情報生成処理について詳細に説明する。 FIG. 8 is a flowchart showing overall processing of the hierarchical structure management apparatus according to the present embodiment. First, the word information generation part 22 performs a word information generation process (S81). This word information generation process will be described in detail.
図9は、本実施形態に係る階層構造管理装置における単語情報生成処理を示すフローチャートである。まず、単語情報の初期状態を空にする(S91)。旧階層構造を構成する各ノード(ノード名称及びファイル名称)について、形態素解析アルゴリズムを用いて単語の集合に分解する(S92)。例えば、「仕様書_May20」というノード名称の場合は、「仕様書、May、20」に分解する。ここで、分解する単語は自立語に限定してもよい。同一の単語が既に登録されているかどうかを判定し、登録されていない場合にのみ単語情報に登録し、固有の単語IDを付与する(S93)。このとき、各単語のカテゴリIDは未定義としておく。 FIG. 9 is a flowchart showing word information generation processing in the hierarchical structure management apparatus according to the present embodiment. First, the initial state of word information is emptied (S91). Each node (node name and file name) constituting the old hierarchical structure is decomposed into a set of words using a morphological analysis algorithm (S92). For example, in the case of the node name “specification_May20”, it is decomposed into “specification, May, 20”. Here, the words to be decomposed may be limited to independent words. It is determined whether or not the same word has already been registered, and if it is not registered, it is registered in the word information and given a unique word ID (S93). At this time, the category ID of each word is undefined.
図10に、図4の旧階層構造に基づいて生成された単語情報を示す。この単語情報においては、単語を表す文字列が異なる場合であっても意味が同一(同義語)であれば同一の単語IDが付与され、単語の字面が同じであっても意味が異なる場合(多義語)には、異なる単語IDが付与される。図9の処理では、単語の文字列が異なれば異なる単語IDが付与されるものであるが、上記の同義語、多義語の処理については、第2の実施形態において詳細を後述する。 FIG. 10 shows word information generated based on the old hierarchical structure of FIG. In this word information, even if the character strings representing the words are different, if the meanings are the same (synonyms), the same word ID is given, and even if the word faces are the same, the meanings are different ( Different word IDs are given to the polysemy. In the processing of FIG. 9, different word IDs are assigned if the character strings of the words are different. Details of the processing of the above synonyms and polysemy will be described later in the second embodiment.
図10のカテゴリIDは、観点ごとに異なる単語を分類するためのものであり、同一の観点に属する単語には同一のカテゴリIDが付与される。すなわち、同一のカテゴリIDを持つ単語が集まって1つの新階層構造を形成する。なお、各単語は1つのカテゴリにのみ属するものとする。また、カテゴリに属さない単語があっても良いが、その単語は新階層構造に出現することはない。さらに、2つ以上のカテゴリに属する単語はないものと仮定する。 The category ID in FIG. 10 is for classifying different words for each viewpoint, and the same category ID is assigned to words belonging to the same viewpoint. That is, words having the same category ID gather to form one new hierarchical structure. Each word belongs to only one category. There may be a word that does not belong to the category, but the word does not appear in the new hierarchical structure. Further assume that no words belong to more than one category.
図9の処理の時点では、このカテゴリIDは未定義となっているが、後述する第1階層構造生成部23、及び第n階層構造生成部24の処理で付与される。このような単語情報を構築すれば、新階層構造におけるノード間の対応関係やノードとファイルとの対応関係を容易に再構成することができる。つまり、単語情報中で各カテゴリに属する単語の集合を求め、それを用いて旧階層構造の再構成処理を実行することで、対応情報を計算することができる。 At the time of the processing of FIG. 9, this category ID is undefined, but is assigned by the processing of the first hierarchical structure generating unit 23 and the nth hierarchical structure generating unit 24 described later. By constructing such word information, it is possible to easily reconfigure the correspondence between nodes and the correspondence between nodes and files in the new hierarchical structure. That is, the correspondence information can be calculated by obtaining a set of words belonging to each category in the word information and executing the reconstruction process of the old hierarchical structure using the set.
図8に戻って、第1階層構造生成部23が第1階層構造生成処理を行う(S82)。ここでは、旧階層構造から重複して出現する単語(重複単語とする)を全て切り出して簡素化し、最終的に残ったノードとファイルを第1の新階層構造とする処理である。この第1階層構造生成処理について詳細に説明する。 Returning to FIG. 8, the first hierarchical structure generating unit 23 performs the first hierarchical structure generating process (S82). Here, it is a process of cutting out and simplifying all the words (duplicated words) that appear redundantly from the old hierarchical structure, and finally setting the remaining nodes and files to the first new hierarchical structure. The first hierarchical structure generation process will be described in detail.
図11は、本実施形態に係る階層構造管理装置における第1階層構造生成処理を示すフローチャートである。まず、単語集合Wを、単語情報生成部22で生成された単語情報に登録されている全ての単語とし(S111)、処理の対象となる作業用の階層構造を旧階層構造とする(S112)。旧階層構造から切り出した重複単語のリストXの初期値を空にする(S113)。作業用の階層構造を構成する各ノードに対して、根ノードからの距離が近い順に以下の処理を行う。 FIG. 11 is a flowchart showing a first hierarchical structure generation process in the hierarchical structure management apparatus according to the present embodiment. First, the word set W is set as all the words registered in the word information generated by the word information generation unit 22 (S111), and the work hierarchical structure to be processed is set as the old hierarchical structure (S112). . The initial value of the duplicate word list X cut out from the old hierarchical structure is emptied (S113). The following processing is performed in the order of the distance from the root node for each node constituting the working hierarchical structure.
作業用の階層構造のノードを構成する各単語wが、階層構造中に2回以上出現する場合
に、単語集合Wから単語wを削除する(S114)。この処理を図12に示す。ここでは、根ノードから近い順に、各階層レベルに対して処理を行う。図12において、第1階層レベルの4つのノードの名称について、重複して出現する単語を抽出すると、単語w{鈴木、佐藤}が抽出される。このw{鈴木、佐藤}が単語集合Wから削除される。
When each word w constituting the node of the working hierarchical structure appears twice or more in the hierarchical structure, the word w is deleted from the word set W (S114). This process is shown in FIG. Here, processing is performed on each hierarchical level in the order from the root node. In FIG. 12, when a word that appears redundantly is extracted from the names of the four nodes at the first hierarchical level, the word w {Suzuki, Sato} is extracted. This w {Suzuki, Sato} is deleted from the word set W.
単語wが削除された新たな単語集合Wを用いて、作業用の階層構造に対して再構成処理を行う(S115)。すなわち、w{鈴木、佐藤}を除く単語集合を入力として、作業用の階層構造に対して、再構成処理部21が図3で説明した再構成処理を実行する。重複単語のリストXに単語w{鈴木、佐藤}を追加する(S116)。S115の再構成処理を実行した結果を図13に示す。図13では、作業用の階層構造からw{鈴木、佐藤}の単語が削除されると共に、同一名称の兄弟ノードが統合されて簡素化されている。 Using the new word set W from which the word w has been deleted, a reconstruction process is performed on the working hierarchical structure (S115). That is, with the word set excluding w {Suzuki, Sato} as input, the reconstruction processing unit 21 executes the reconstruction processing described in FIG. 3 for the working hierarchical structure. The word w {Suzuki, Sato} is added to the duplicate word list X (S116). FIG. 13 shows the result of executing the reconstruction process in S115. In FIG. 13, the word w {Suzuki, Sato} is deleted from the working hierarchical structure, and sibling nodes with the same name are integrated and simplified.
同様に、図13の階層構造に対して、第1階層レベルの単語のうち重複して出現する単語を抽出し、単語集合Wから削除する。具体的には、単語w{教育、研究、2008}が単語集合Wから削除され、重複単語リストXに追加される。そして、単語集合Wを用いて再構成処理が行われる。その結果を図14(A)に示す。 Similarly, in the hierarchical structure of FIG. 13, words that appear redundantly among the words at the first hierarchical level are extracted and deleted from the word set W. Specifically, the word w {education, research, 2008} is deleted from the word set W and added to the duplicate word list X. Then, reconstruction processing is performed using the word set W. The result is shown in FIG.
図14(A)は、図13に比べてさらにw{教育、研究、2008}の単語が削除されて簡素化されている。図14(A)において第1階層レベルの単語に重複単語がないため、第2階層レベルの重複単語を抽出する。ここでは、単語w{渡辺}が抽出され、単語集合Wから削除されると共に重複単語リストXに追加される。そして、単語集合Wを用いて再構成処理が行われる。その結果を図14(B)に示す。全ての階層レベルで重複単語の抽出を行い、重複単語がなくなったら最終的に単語集合Wに含まれる全ての単語について、カテゴリID=1を設定する(S117)。すなわち、図14(B)に示すような第1の新階層構造が決定される。 In FIG. 14A, the word w {education, research, 2008} is further deleted and simplified as compared with FIG. In FIG. 14A, since there are no duplicate words in the first hierarchy level, duplicate words at the second hierarchy level are extracted. Here, the word w {Watanabe} is extracted, deleted from the word set W, and added to the duplicate word list X. Then, reconstruction processing is performed using the word set W. The result is shown in FIG. Duplicate words are extracted at all hierarchical levels, and when there are no duplicate words, category ID = 1 is set for all words finally included in the word set W (S117). That is, the first new hierarchical structure as shown in FIG. 14B is determined.
なお、図12、図13、及び図14(A)にはファイルを図示していないが、実際には図4の対応関係にしたがって、各ノードにファイルが対応付けられているものとする。また、図14(B)に示すように「社会貢献」のような、妥当とは言いにくいノードが含まれる可能性があるが、これらのノードについては、第2の実施形態で説明する機能を用いて解消することができる。 Although FIG. 12, FIG. 13 and FIG. 14A do not show the file, it is assumed that the file is actually associated with each node according to the correspondence relationship of FIG. Further, as shown in FIG. 14B, there may be a node that is difficult to say, such as “social contribution”. For these nodes, the function described in the second embodiment is provided. Can be eliminated.
このように、上記処理により、重複する単語が名称に含まれるノードについて重複をなくして排他的とし、一の観点で分類した階層構造を容易に自動生成することができる。 In this way, the above processing makes it possible to eliminate the duplication of nodes including duplicate words in the name and make them exclusive, and to easily automatically generate a hierarchical structure classified from one viewpoint.
図8に戻って、第n階層構造生成部24が第n階層構造生成処理を行う(S83)。ここでは、各単語にカテゴリIDを1つずつ割り当てる。S82の処理でカテゴリID=1(第1の新階層構造)が決定しているため、ここでは、2以降のカテゴリID(第2以降の新階層構造)を決定する。この第n階層構造生成処理について詳細に説明する。 Returning to FIG. 8, the n-th hierarchical structure generation unit 24 performs the n-th hierarchical structure generation process (S83). Here, one category ID is assigned to each word. Since category ID = 1 (first new hierarchical structure) is determined in the process of S82, category IDs after 2 (second and subsequent new hierarchical structures) are determined here. The nth hierarchical structure generation process will be described in detail.
図15は、本実施形態に係る階層構造管理装置における第n階層構造生成処理を示すフローチャートである。まず、既存のカテゴリCを空集合に初期化し(S151)、保留する単語を登録する保留リストSを初期化して空リストにする(S152)。重複単語のリストXに登録されている単語wに対して、重複単語のリストXに追加された順に以下の処理を行う。 FIG. 15 is a flowchart showing the n-th hierarchical structure generation process in the hierarchical structure management apparatus according to the present embodiment. First, an existing category C is initialized to an empty set (S151), and a reserved list S for registering words to be reserved is initialized to an empty list (S152). For the word w registered in the duplicate word list X, the following processing is performed in the order added to the duplicate word list X.
既存のカテゴリCに単語wを追加し、カテゴリCに属する単語集合で作業用の階層構造に対して再構成処理を行う(S153)。初期の状態ではカテゴリCは空集合(第2以降の新階層構造が全く形成されていない)であるため、重複単語のリストXに最初に追加された重複単語のみで構成される階層構造が形成される。初期の状態ではなく、既にカテゴ
リCに単語が分類されている(第2以降の新階層構造の少なくとも一部が形成されている)場合は、そのカテゴリCの単語集合で再構成処理が行われる。
The word w is added to the existing category C, and the reconstruction process is performed on the working hierarchical structure with the word set belonging to the category C (S153). In the initial state, category C is an empty set (no new hierarchical structure after the second is formed at all), so a hierarchical structure composed only of the duplicate words added first to the duplicate word list X is formed. Is done. If the word is already classified into category C (at least a part of the second and subsequent new hierarchical structures is formed) instead of the initial state, reconstruction processing is performed on the category C word set. .
再構成処理の結果、階層構造に単語wが1回しか出現しない場合は、単語wをカテゴリCに追加可能とする(S154)。単語wがカテゴリCに追加可能の場合、再構成処理の結果、階層構造の根ノードに対応付けられるファイル数を算出する(S155)。ここで算出したファイル数は、後の処理で利用するためである。単語wを追加可能なカテゴリ候補が1つしかない場合は、単語wをそのカテゴリに分類する(S156)。単語wを追加可能なカテゴリ候補がない場合は、単語wを新たなカテゴリに分類する(S157)。ここで、これらの処理について、下記の表1及び図16を例に具体的に説明する。下記の表1は、図11の処理で得られた重複単語のリストXを示している。 As a result of the reconstruction process, if the word w appears only once in the hierarchical structure, the word w can be added to the category C (S154). When the word w can be added to the category C, the number of files associated with the root node of the hierarchical structure is calculated as a result of the reconstruction process (S155). This is because the number of files calculated here is used in later processing. If there is only one category candidate to which the word w can be added, the word w is classified into that category (S156). If there is no category candidate to which the word w can be added, the word w is classified into a new category (S157). Here, these processes will be specifically described with reference to the following Table 1 and FIG. Table 1 below shows a list X of duplicate words obtained by the process of FIG.
図16(A)は前提として、まず重複単語のリストXに最初に追加された「鈴木」が、カテゴリCが空の状態でカテゴリCに分類された後に、重複単語のリストXに2番目に追加された「佐藤」について、カテゴリCに追加可能であるかどうかの判定(具体的には、{鈴木、佐藤}で作業用の階層構造に対して再構成処理を行い、その結果「佐藤」が1回しか出現しないかどうか)がなされ、ここでは、追加可能であると判定され、「鈴木」、「佐藤」が同一のカテゴリCに分類された状態であるとしている。 FIG. 16 (A) assumes that “Suzuki” first added to the duplicate word list X is classified into the category C with the category C being empty, and then second to the duplicate word list X. A determination as to whether or not the added “Sato” can be added to the category C (specifically, {Suzuki, Sato} performs a reconfiguration process on the working hierarchical structure, and the result is “Sato”. In this case, it is determined that it can be added, and “Suzuki” and “Sato” are classified into the same category C.
この状態で、重複単語のリストXに3番目に追加された「2008」がカテゴリCに追加可能かどうかを判定する。{鈴木、佐藤、2008}で作業用の階層構造に対して再構成処理を行った結果、図16(A)に示すように「2008」が複数回出現した。したがって、「2008」を追加可能なカテゴリがないため、「2008」を新たなカテゴリに分類している。すなわち、図16(A)に示すように、{鈴木、佐藤}のカテゴリと{2008}のカテゴリが形成される。同様にして、「教育」、「研究」と続けて処理した結果を図16(B)に示す。この段階で3つのカテゴリが形成されることになる。以降、上記表1の重複単語について処理を繰り返して行う。 In this state, it is determined whether or not “2008” added third to the duplicate word list X can be added to the category C. As a result of performing the reconstruction process on the working hierarchical structure in {Suzuki, Sato, 2008}, “2008” appears multiple times as shown in FIG. Therefore, since there is no category to which “2008” can be added, “2008” is classified into a new category. That is, as shown in FIG. 16A, a category of {Suzuki, Sato} and a category of {2008} are formed. Similarly, the results of processing “education” and “research” in succession are shown in FIG. At this stage, three categories are formed. Thereafter, the process is repeated for the duplicate words in Table 1 above.
なお、重複単語のリストXは単純な集合ではなく、追加して順序で単語を保持するFIFO(先入れ先出し:First-in First-out)キューで定義されることが望ましい。また、重複単語のリストXや単語集合Wは、単語IDのみを保持できれば十分である。 It should be noted that the duplicate word list X is not a simple set, but is preferably defined by a FIFO (First-in First-out) queue that holds the words in order. In addition, the duplicate word list X and the word set W need only hold the word ID.
図15に戻って、単語wが追加可能なカテゴリ候補が複数ある場合は、S155で算出した根ノードに対応付けられているファイル数が最小であるカテゴリ候補に、単語wを分類する(S158)。ここで、S158の処理について、図17、図18を例に説明する。図17には3つのカテゴリ({鈴木、佐藤}、{2008}、{教育、研究})に分類された単語で構成される3つの新階層構造が示されており、その状態で「渡辺」を分類する。各カテゴリごとに、単語「渡辺」を追加して再構成処理を行うと、「渡辺」が1回し
か出現しないカテゴリ候補が{鈴木、佐藤}と{2008}である。この場合、カテゴリ候補が2つあるので、再構成処理の結果、根ノードに対応付けられているファイル数が最小であるカテゴリ候補に単語「渡辺」を分類する。
Returning to FIG. 15, when there are a plurality of category candidates to which the word w can be added, the word w is classified into the category candidates with the smallest number of files associated with the root node calculated in S155 (S158). . Here, the processing of S158 will be described with reference to FIGS. FIG. 17 shows three new hierarchical structures composed of words classified into three categories ({Suzuki, Sato}, {2008}, {Education, Research}). In this state, “Watanabe” is shown. Classify. When the word “Watanabe” is added for each category and reconfiguration processing is performed, category candidates in which “Watanabe” appears only once are {Suzuki, Sato} and {2008}. In this case, since there are two category candidates, the word “Watanabe” is classified into a category candidate having the smallest number of files associated with the root node as a result of the reconstruction process.
図18(A)は、{鈴木、佐藤、渡辺}を単語集合として再構成処理を行った場合の結果を示し、図18(B)は、{2008、渡辺}を単語集合として再構成処理を行った場合の結果を示している。図18から明らかなように、{鈴木、佐藤、渡辺}の場合は、根ノードに対応付けられているファイル数が0であり、{2008、渡辺}の場合は、根ノードに対応付けられているファイル数が11であるため、単語「渡辺」は、{鈴木、佐藤、渡辺}のカテゴリに分類される。つまり、ファイルが根ノードに対応付けられているということは、どのノードにも属しない未整理のファイルであることを意味しているため、未整理ファイルが少ない階層構造ほど、きちんと整理された階層構造であると判断することができ、より整理された階層構造に単語を分類するように処理を行う。 FIG. 18A shows the result of performing reconstruction processing using {Suzuki, Sato, Watanabe} as a word set, and FIG. 18B shows the reconstruction processing using {2008, Watanabe} as a word set. The results are shown. As is clear from FIG. 18, in the case of {Suzuki, Sato, Watanabe}, the number of files associated with the root node is 0, and in the case of {2008, Watanabe}, the file is associated with the root node. Since the number of files is 11, the word “Watanabe” is classified into the category {Suzuki, Sato, Watanabe}. In other words, the fact that the file is associated with the root node means that it is an unorganized file that does not belong to any node, so the hierarchical structure with fewer unorganized files is a more organized hierarchy. It can be determined that the word is structured, and processing is performed so as to classify words into a more organized hierarchical structure.
図15に戻って、単語wを追加可能なカテゴリ候補が複数あり、根ノードに対応するファイル数が最小となるカテゴリ候補が複数ある場合は、単語wの分類を一旦保留にし、保留リストSに単語wを追加する(S159)。重複単語のリストXに登録されている他の単語wが1つ又は複数分類されるごと、又は他の単語wが全て分類されてから、保留リストSに登録された単語wsに対し、保留リストSに追加された順にS153〜S158と同様の処理を行う(S160)。 Returning to FIG. 15, when there are a plurality of category candidates to which the word w can be added and there are a plurality of category candidates with the smallest number of files corresponding to the root node, the classification of the word w is temporarily put on hold in the hold list S. The word w is added (S159). Each time one or a plurality of other words w registered in the duplicate word list X are classified, or after all other words w are classified, the reserved list for the word ws registered in the reserved list S The same processing as S153 to S158 is performed in the order added to S (S160).
すなわち、カテゴリに分類できずに保留リストSに登録された単語wであっても、他の単語がカテゴリに分類されることで、保留リストSに登録された単語wsが分類できるようになっている可能性がある。そのため、他の単語wを先に処理してから、再度保留リストSに登録された単語wsについて処理を行う。 That is, even if the word w cannot be classified into the category and is registered in the holding list S, the word ws registered in the holding list S can be classified by classifying other words into the category. There is a possibility. For this reason, after processing another word w first, the word ws registered in the hold list S is processed again.
保留リストSに追加された単語wsについて、追加可能なカテゴリ候補が複数あり、根ノードに対応するファイル数が最小となるカテゴリ候補が複数ある場合は、単語wsをカテゴリ候補のいずれかにランダムに分類する(S161)。 When there are a plurality of category candidates that can be added to the word ws added to the hold list S and there are a plurality of category candidates that minimize the number of files corresponding to the root node, the word ws is randomly assigned to one of the category candidates. Classify (S161).
以上の処理により全ての単語wにカテゴリIDが付与され、複数の新階層構造が形成される。その結果を図19に示す。図4に示す1次元の旧階層構造から、上記処理を実行することで、図19のように最終的に5つの異なる分類基準に基づく新階層構造が形成される。 Through the above processing, category IDs are assigned to all the words w, and a plurality of new hierarchical structures are formed. The result is shown in FIG. By executing the above processing from the one-dimensional old hierarchical structure shown in FIG. 4, a new hierarchical structure based on five different classification criteria is finally formed as shown in FIG.
なお、S158の処理の段階で単語wを追加可能なカテゴリ候補が複数ある場合に、根ノードに対応付けられるファイル数の比較を行わずに、カテゴリ候補にランダムに分類するようにしてもよい。その場合は、ステップS155の処理や根ノードに対応付けられるファイル数に関する処理は行う必要がない。 If there are a plurality of category candidates to which the word w can be added at the stage of processing in S158, the category candidates may be randomly classified without comparing the number of files associated with the root node. In that case, it is not necessary to perform the process in step S155 or the process related to the number of files associated with the root node.
また、S158の処理の段階で単語wを保留リストSに追加せずに、カテゴリ候補にランダムに分類するようにしてもよい。その場合は、保留リストS及び保留リストSに関連する処理は不要である。 Further, the word w may be randomly classified into the category candidates without adding the word w to the holding list S in the process of S158. In that case, the processing related to the holding list S and the holding list S is unnecessary.
さらに、カテゴリを保持するためのデータ構造としては、上記に示すようにリスト(又は集合)を用いるのが望ましく、その要素は単語IDやカテゴリIDとなる。また、重複単語のリストXに登録されている単語wは、図11で設定されたカテゴリID=1のカテゴリで重複して出現することが確認されているため、カテゴリID=1はカテゴリCに含まれないものとする。 Furthermore, as the data structure for holding the category, it is desirable to use a list (or set) as described above, and its elements are a word ID and a category ID. Further, since it has been confirmed that the word w registered in the duplicate word list X appears in the category of category ID = 1 set in FIG. It shall not be included.
さらにまた、重複単語のリストXや保留リストSに含まれる各単語に対しては、既存のカテゴリ毎に追加可能か否かを判定するが、その結果を保持するために、一次元配列を定義してもよい。その場合、配列の要素数はカテゴリ数と一致する。また、配列の要素は単語w(又は単語ws)が当該カテゴリに追加可能か否かを現すBoolean型の値と、単語w(又は単語ws)をカテゴリCに追加して再構成したツリーにおいて、根ノードに対応するファイル数との2つのフィールドを持つ構造体としてもよい。 Furthermore, for each word included in the duplicate word list X and the pending list S, it is determined whether or not it can be added for each existing category, but in order to hold the result, a one-dimensional array is defined. May be. In that case, the number of elements in the array matches the number of categories. In addition, the elements of the array are a Boolean type value indicating whether or not the word w (or word ws) can be added to the category, and a tree reconstructed by adding the word w (or word ws) to the category C. A structure having two fields of the number of files corresponding to the root node may be used.
図8に戻って、S81からS83の処理で生成された新階層構造に対して、新階層構造を精錬する処理が行われる(S84)。この階層構造洗練処理は、第2の実施形態で詳細を説明する。 Returning to FIG. 8, a process for refining the new hierarchical structure is performed on the new hierarchical structure generated in the processes of S81 to S83 (S84). This hierarchical structure refinement process will be described in detail in the second embodiment.
なお、旧階層構造に新たなノードやファイルが追加された場合には、単語情報を再構成する必要がある。そのためには、上記各処理に以下の変更を加えることで対応することができる。(1)図9のS91の単語情報の初期状態を空にする処理を、既に構築されている単語情報を初期状態とする処理に変更する。(2)図11のS111の単語集合Wを単語情報に登録されている全ての単語とする処理を、単語集合Wを単語情報に登録されている単語のうち、カテゴリIDが1又は未定義のものとする処理に変更すると共に、S112の処理対象となる階層構造を旧階層構造とする処理を、処理対象となる階層構造を単語集合Wを用いて旧階層構造を再構成処理したものとする処理に変更する。(3)図15のS151の既存のカテゴリを空集合に初期化する処理を、単語情報に登録されているカテゴリ集合を既存のカテゴリとする処理に変更する。
以上の処理に変更することで、旧階層構造に新たなノードやファイルが追加された場合に対応することができる。
When a new node or file is added to the old hierarchical structure, it is necessary to reconstruct word information. To that end, it is possible to cope with the above changes by adding the following changes. (1) The process of emptying the initial state of the word information in S91 in FIG. 9 is changed to a process of setting the already constructed word information to the initial state. (2) The process of setting the word set W in S111 of FIG. 11 as all the words registered in the word information, the category ID is 1 or undefined among the words registered in the word information. In addition to the processing to be assumed, the processing in which the processing target hierarchical structure in S112 is changed to the old hierarchical structure, and the processing target hierarchical structure is reconfigured using the word set W. Change to processing. (3) The process of initializing the existing category in S151 of FIG. 15 to the empty set is changed to a process of setting the category set registered in the word information as an existing category.
By changing to the above processing, it is possible to cope with a case where a new node or file is added to the old hierarchical structure.
(本発明の第2の実施形態)
本実施形態に係る階層構造管理装置について、図20ないし図27を用いて説明する。本実施形態に係る階層構造管理装置は、複数の分類基準に基づいて新階層構造が形成されている場合に、高水準操作により新階層構造をチェック、編集する機能を有するものである。高水準操作を行う対象は、第1の実施形態に係る階層構造管理装置により形成された複数の新階層構造であってもよいし、他の手法で形成された異なる分類基準に基づく複数の新階層構造であってもよい。
(Second embodiment of the present invention)
The hierarchical structure management apparatus according to the present embodiment will be described with reference to FIGS. The hierarchical structure management apparatus according to the present embodiment has a function of checking and editing a new hierarchical structure by high-level operation when a new hierarchical structure is formed based on a plurality of classification criteria. The target for high-level operation may be a plurality of new hierarchical structures formed by the hierarchical structure management apparatus according to the first embodiment, or a plurality of new levels based on different classification criteria formed by other methods. It may be a hierarchical structure.
なお、本実施形態において、前記第1の実施形態と重複する説明については省略する。 In the present embodiment, descriptions overlapping with those in the first embodiment are omitted.
図20は、本実施形態に係る階層構造管理装置の機能ブロック図である。図2の場合と異なるのは、新たにチェック処理部201と編集処理部202とを備えることである。なお、上述したように、本実施形態では必ずしも第1の実施形態に係る階層構造管理装置により形成された複数の新階層構造を処理対象とする必要がないことから、単語情報生成部22、第1階層構造生成部23、及び第n階層構造生成部24は備えない構成であってもよい。 FIG. 20 is a functional block diagram of the hierarchical structure management apparatus according to this embodiment. The difference from the case of FIG. 2 is that a check processing unit 201 and an editing processing unit 202 are newly provided. As described above, in the present embodiment, since it is not always necessary to process a plurality of new hierarchical structures formed by the hierarchical structure management apparatus according to the first embodiment, the word information generation unit 22, the first The 1-layer structure generation unit 23 and the n-th layer structure generation unit 24 may be omitted.
チェック処理部201は、追加可能なカテゴリ候補が複数ある単語や一の新階層構造内で重複して出現する単語を抽出する。また、利用者から指定された単語又は単語集合(例えば、任意の新階層構造における任意のノード)が指定された場合に、その指定された単語又は単語集合を追加可能なカテゴリ候補を抽出する。追加可能なカテゴリは、前記第1の実施形態の場合と同様に、各カテゴリを構成する単語に、指定された単語又は単語集合を追加した単語集合で再構成処理を行った場合に、追加した単語又は単語集合が1回しか出現しない場合に、そのカテゴリに追加可能とする。 The check processing unit 201 extracts words that have a plurality of category candidates that can be added and words that appear redundantly in one new hierarchical structure. Further, when a word or word set designated by the user (for example, any node in any new hierarchical structure) is designated, category candidates to which the designated word or word set can be added are extracted. Similar to the case of the first embodiment, the categories that can be added are added when the word constituting each category is reconfigured with a word set obtained by adding a specified word or a word set. When a word or word set appears only once, it can be added to the category.
編集処理部202は、複数の新階層構造間での単語又は単語集合の移動の制御、指定さ
れた単語又は単語集合の削除、指定された単語又は単語集合を同義語として設定、指定された単語又は単語集合を多義語として指定する等の処理を行い、新階層構造の編集を制御する。
The edit processing unit 202 controls the movement of a word or a word set between a plurality of new hierarchical structures, deletes the specified word or word set, sets the specified word or word set as a synonym, and specifies the specified word Alternatively, processing such as designating a word set as a polysemy is performed to control editing of the new hierarchical structure.
表示制御部26は、旧階層構造や新階層構造を管理ファイル27や対応情報部28に基づいて表示画面29に表示すると共に、チェック処理部201の処理結果や編集処理部202の処理結果を反映させて、表示画面29の旧階層構造や新階層構造の表示を制御する。 The display control unit 26 displays the old hierarchical structure and the new hierarchical structure on the display screen 29 based on the management file 27 and the correspondence information unit 28, and reflects the processing result of the check processing unit 201 and the processing result of the editing processing unit 202. Thus, the display of the old hierarchical structure and the new hierarchical structure of the display screen 29 is controlled.
次に、チェック処理部201の処理について詳細に説明する。チェック処理部201と表示制御部26との第1の機能として、追加可能なカテゴリ候補が複数ある単語をそうではない単語と区別して表示する。指定された新階層構造において、他の新階層構造に移動しても1回しか出現しない単語を、他の単語と区別して表示する。図21にその一例を示す。図21に示すように、多数のノードが異なる態様で表示されている。 Next, the processing of the check processing unit 201 will be described in detail. As a first function of the check processing unit 201 and the display control unit 26, a word having a plurality of category candidates that can be added is displayed separately from words that are not. In the designated new hierarchical structure, a word that appears only once even when moved to another new hierarchical structure is displayed separately from other words. An example is shown in FIG. As shown in FIG. 21, a large number of nodes are displayed in different modes.
例えば、「2010」、「2009」、「2007以前」、「2007」、「2006以前」が同一の表示態様で示されており、その表示態様はカテゴリID=3となっている。これは、「2010」、「2009」、「2007以前」、「2007」、「2006以前」については、カテゴリID=3に追加可能であることを意味している。すなわち、「2010」、「2009」、「2007以前」、「2007」、「2006以前」の各単語について、カテゴリID=3に追加して再構成処理を行った場合に、各単語が1回しか出現しないということになる。同様に、「社会貢献」、「講義資料」はカテゴリID=4、「tex」はカテゴリID=5、「2008」はカテゴリID=1、「実験データ」はカテゴリID=2にそれぞれ追加可能であることを、視覚的に容易に確認することができる。 For example, “2010”, “2009”, “before 2007”, “2007”, “before 2006” are shown in the same display mode, and the display mode is category ID = 3. This means that “2010”, “2009”, “before 2007”, “2007”, and “before 2006” can be added to category ID = 3. That is, for each word of “2010”, “2009”, “before 2007”, “2007”, and “before 2006”, when the reconfiguration process is performed in addition to the category ID = 3, each word is once It will only appear. Similarly, “social contribution” and “lecture material” can be added to category ID = 4, “tex” can be added to category ID = 5, “2008” can be added to category ID = 1, and “experimental data” can be added to category ID = 2. It can be easily confirmed visually.
チェック処理部201と表示制御部26との第2の機能として、一の新階層構造内で重複して出現する単語を区別して表示する。一の新階層構造において、同一の単語が2回以上出現する場合、該当する単語を区別して表示する。これにより、その単語を他の新階層構造に移動すべきか否かを検討するための手掛かりを利用者に提供する。 As a second function of the check processing unit 201 and the display control unit 26, words that appear redundantly in one new hierarchical structure are distinguished and displayed. When the same word appears twice or more in one new hierarchical structure, the corresponding word is distinguished and displayed. This provides the user with a clue to consider whether the word should be moved to another new hierarchical structure.
なお、前記第1の実施形態により新階層構造を作成した場合、作成直後は一の新階層構造に同一の単語が2回以上出現することはないが、その後にファイルやノードを追加した場合、第1の実施形態により新階層構造を作成しなかった場合には、一の新階層構造に同一の単語が2回以上出現することがあり、その場合に本機能が有効となる。 When a new hierarchical structure is created according to the first embodiment, the same word does not appear more than once in one new hierarchical structure immediately after creation, but when a file or node is added after that, When the new hierarchical structure is not created according to the first embodiment, the same word may appear twice or more in one new hierarchical structure, and in this case, this function is effective.
図22に表示の一例を示す。図22は、複数の新階層構造のうちの一の新階層構造を示している。図22に示すように、重複して出現している単語「教育」、「研究」、「2008」が、その重複している単語との関係及び重複していない単語との関係において区別して表示されている。これにより、一の新階層構造に2回以上出現する単語を視覚的に容易に確認することができる。なお、利用者が重複している単語を1つ選択した場合には、それと一致する単語を一括して選択できる機能を提供してもよい。 FIG. 22 shows an example of display. FIG. 22 shows one new hierarchical structure among a plurality of new hierarchical structures. As shown in FIG. 22, the words “education”, “research”, and “2008” appearing in duplicate are distinguished and displayed in relation to the overlapping word and in relation to the non-overlapping word. Has been. As a result, words that appear twice or more in one new hierarchical structure can be easily visually confirmed. In addition, when the user selects one overlapping word, a function may be provided in which words that match the word are selected in a lump.
チェック処理部201と表示制御部26との第3の機能として、利用者から指定された単語又は単語集合が指定された場合に、その指定された単語又は単語集合を追加可能なカテゴリ候補を抽出し、指定された単語又は単語集合に対応付けて表示する。すなわち、指定された単語又は単語集合の近傍に、その指定された単語又は単語集合が重複して出現しないカテゴリを一覧表示する。この処理により、利用者は、指定された単語又は単語集合を他の新階層構造に移動する前に、その追加可能なカテゴリ候補を確認することができる。 As a third function of the check processing unit 201 and the display control unit 26, when a word or word set designated by the user is designated, category candidates to which the designated word or word set can be added are extracted. And displayed in association with the designated word or word set. That is, a list of categories in which the designated word or word set does not appear redundantly is displayed in the vicinity of the designated word or word set. By this processing, the user can confirm the category candidates that can be added before moving the designated word or word set to another new hierarchical structure.
図23に表示の一例を示す。図23には、カテゴリID=2の新階層構造において、「講義資料」の単語集合が指定された場合に、追加可能なカテゴリ候補がカテゴリID=4であることを示している。つまり、「講義資料」の単語集合をカテゴリID=4に追加して再構成処理を行った場合、「講義資料」が1回しか出現しないことを意味している。 FIG. 23 shows an example of display. FIG. 23 shows that the category candidate that can be added is category ID = 4 when the word set of “lecture material” is designated in the new hierarchical structure of category ID = 2. That is, when the word set of “lecture material” is added to category ID = 4 and the reconstruction process is performed, it means that “lecture material” appears only once.
次に、編集処理部202の処理について詳細に説明する。編集処理部202の第1の機能として、複数の新階層構造間での単語又は単語集合の移動の制御を行う。利用者は複数の新階層構造のいずれかで、1個以上の単語を指定する。その後、移動先の新階層構造を指定する。編集処理部202は、移動先の新階層構造に対応するカテゴリIDを、指定された単語のカテゴリIDに代入し再構成処理を行う。そうすることで、指定された単語は、移動元のカテゴリIDから除外され、移動先のカテゴリIDに追加され、新階層構造間の単語の移動が実現される。 Next, the processing of the edit processing unit 202 will be described in detail. As a first function of the edit processing unit 202, the movement of a word or a word set between a plurality of new hierarchical structures is controlled. The user designates one or more words in any of a plurality of new hierarchical structures. After that, the new hierarchical structure of the destination is specified. The edit processing unit 202 performs a reconstruction process by substituting the category ID corresponding to the new hierarchical structure of the movement destination into the category ID of the designated word. By doing so, the designated word is excluded from the category ID of the movement source, added to the category ID of the movement destination, and the movement of the word between the new hierarchical structures is realized.
図24、図25に移動処理の一例を示す。図24に示すように、例えば「社会貢献」、「講義資料」はカテゴリID=4に追加可能であり、「tex」はカテゴリID=5に追加可能であり、「2008」はカテゴリID=1に追加可能であるとし、それらの単語を追加可能なカテゴリに移動する。移動した結果を図25に示す。図24において、利用者は対象となる単語と移動先のカテゴリを指定するだけでよく、図25のように移動後の新階層構造は、再構成処理により自動計算される。また、第1の実施形態で新階層構造を生成した結果、一部に妥当でない分類が含まれていたとしても、この移動操作を行うことで、図25に示すように矛盾なく正確に分類された新階層構造を生成することができる。このとき、カテゴリID=3については、ノードが空になったため削除される。また、移動後は図26に示すように単語情報が更新される。 24 and 25 show an example of the movement process. As shown in FIG. 24, for example, “social contribution” and “lecture material” can be added to category ID = 4, “tex” can be added to category ID = 5, and “2008” is category ID = 1. And move those words to a category where they can be added. The result of the movement is shown in FIG. In FIG. 24, the user only has to specify the target word and the destination category, and the new hierarchical structure after the movement is automatically calculated by the reconstruction process as shown in FIG. Further, as a result of generating a new hierarchical structure in the first embodiment, even if some of the classifications are not valid, this moving operation allows accurate classification without any contradiction as shown in FIG. A new hierarchical structure can be generated. At this time, the category ID = 3 is deleted because the node becomes empty. After the movement, the word information is updated as shown in FIG.
このように、利用者は移動先のカテゴリ(カテゴリに相当する新階層構造)を指定するだけで、単語の移動を行うことができ、階層レベルまで指定する必要がない。なお、移動元の新階層構造の指定、及びその新階層構造における単語集合の指定は利用者に一任されるものとし、全ての新階層構造及び単語を移動対象とすることができる。 In this way, the user can move a word only by specifying a destination category (a new hierarchical structure corresponding to the category), and does not need to specify a hierarchical level. The designation of the new hierarchical structure of the movement source and the designation of the word set in the new hierarchical structure are left to the user, and all new hierarchical structures and words can be moved.
編集処理部202の第2の機能として、指定された単語又は単語集合を削除する。ここでの処理は、ノード名又はファイル名に含まれるものの、分類基準としては不要である単語を削除して、新階層構造の理解容易性を向上させる。利用者が複数の新階層構造のいずれかの新階層構造で、1個以上の単語を指定する。編集処理部202は、指定された単語の単語IDとカテゴリIDを単語情報において無効値に設定する。その後、指定された単語が除かれた状態で再構成処理を行うことで、指定された単語の削除を行う。 As a second function of the edit processing unit 202, the designated word or word set is deleted. In this process, words that are included in the node name or file name but are unnecessary as a classification criterion are deleted, and the ease of understanding the new hierarchical structure is improved. A user designates one or more words in any one of a plurality of new hierarchical structures. The edit processing unit 202 sets the word ID and category ID of the specified word to an invalid value in the word information. Thereafter, the designated word is deleted by performing a reconstruction process in a state where the designated word is removed.
編集処理部202の第3の機能として、指定した複数の単語又は単語集合を同一の意味を持つ同義語として設定する。ここでは、文言が異なるものの、意味は同じである単語を同義語として設定する。利用者は、複数の新階層構造からいずれかの新階層構造で複数の単語又は単語集合を指定する。その際に、利用者は、単語を表示する際に用いる代表値も併せて指定することができる。例えば、「平成22年」と「2010年」を同義語として設定すると共に、表示する際の代表値を「平成22年」と指定した場合には、新階層構造には「平成22年」という単語のみが出現し、「2010年」という表示は新階層構造に出現しない。 As a third function of the edit processing unit 202, a plurality of designated words or word sets are set as synonyms having the same meaning. Here, words having different meanings but having the same meaning are set as synonyms. The user designates a plurality of words or word sets in any one of the plurality of new hierarchical structures. At that time, the user can also specify a representative value used when displaying the word. For example, when “2010” and “2010” are set as synonyms, and the representative value for display is designated as “2010”, the new hierarchical structure is “2010”. Only the word appears, and the indication “2010” does not appear in the new hierarchical structure.
編集処理部202は、利用者の操作に従い、単語情報を更新して指定された複数の単語又は単語集合の単語IDを一致させる。その後、新しい単語情報を用いて再構成処理を行うことで、新階層構造構築する。このような処理により、同一の意味を持つ単語は、階層構造上で兄弟関係にあることが期待されるため、同一の意味を持つ単語が1つにまとめて
、整理された新階層構造を構築することができる。なお、上記で設定した代表値は、必要に応じて変更、切替等の編集をすることができるようにしてもよい。
The edit processing unit 202 updates word information to match word IDs of a plurality of designated words or word sets in accordance with a user operation. Then, a new hierarchical structure is constructed by performing reconstruction processing using new word information. With this process, words with the same meaning are expected to have a sibling relationship in the hierarchical structure, so a new hierarchical structure is organized by combining the words with the same meaning into one. can do. It should be noted that the representative value set above may be edited such as changing or switching as necessary.
編集処理部202の第4の機能として、指定された単語又は単語集合を異なる意味を持つ多義語として設定する。ここでは、文言が一致するものの、意味が異なる単語を多義語として設定する。多義語の設定は、新階層構造を構築する前に予め異なる単語IDを付与しておく必要がある。そのため、表示制御部26が旧階層構造を表示し、その表示された旧階層構造を用いて利用者が指定を行う。利用者は、文言が同じで異なる意味を持つ単語を複数指定し、それらが多義語である旨の操作を行う。編集処理部202は、指定された複数の単語の単語IDを異ならせる。図27にその一例を示す。 As a fourth function of the edit processing unit 202, a designated word or word set is set as a polysemy having a different meaning. Here, words that have the same wording but different meanings are set as ambiguous words. The setting of polysemy needs to be given different word IDs before building a new hierarchical structure. Therefore, the display control unit 26 displays the old hierarchical structure, and the user designates using the displayed old hierarchical structure. The user designates a plurality of words having the same wording and different meanings, and performs an operation to the effect that they are ambiguous words. The edit processing unit 202 changes the word IDs of a plurality of designated words. An example is shown in FIG.
図27において、「鈴木」が4箇所に出現しているが、鈴木Aと鈴木Bと鈴木Cが同一人物を意味し、鈴木Dが異なる人物を意味しているとする。まず、第1の方法として、利用者が鈴木Aと鈴木Dを指定すると共に、多義語の設定をする。同様に鈴木Bと鈴木D、鈴木Cと鈴木Dについても多義語の設定を行う。そして、鈴木A、B、Cが同じ意味であることから、この3つの単語について上記で説明した同義語の設定を行う。そうすることで、鈴木A、B、Cには同じ単語IDが付与され、鈴木Dにのみ異なる単語IDが付与され、多義語を考慮した新階層構造を構築することができる。 In FIG. 27, “Suzuki” appears in four places, and it is assumed that Suzuki A, Suzuki B, and Suzuki C mean the same person, and Suzuki D means a different person. First, as a first method, the user designates Suzuki A and Suzuki D and sets a polysemy. Similarly, polynyms are set for Suzuki B and Suzuki D, and Suzuki C and Suzuki D. Since Suzuki A, B, and C have the same meaning, the synonyms described above are set for these three words. By doing so, the same word ID is given to Suzuki A, B, and C, and a different word ID is given only to Suzuki D, so that a new hierarchical structure can be constructed in consideration of polysemy.
第2の方法として、利用者が鈴木Cと鈴木Dを指定すると共に、多義語の設定をする。同様に、2010Fと鈴木Dを指定して多義語の設定を行う。編集処理部202は、2010Fが指定されることで、2010Fの配下にある全ての「鈴木」を同一の単語IDにすると共に、鈴木Dとの関係で多義語の設定を行う。そして、2010Fと鈴木Cについて上記で説明した同義語の設定を行う。そうすることで、鈴木A、B、Cには同じ単語IDが付与され、鈴木Dにのみ異なる単語IDが付与され、多義語を考慮した新階層構造を構築することができる。第1の方法に比べて、多義語を設定する操作を簡素化することができる。 As a second method, the user designates Suzuki C and Suzuki D and sets a polysemy. Similarly, 2010F and Suzuki D are specified to set a polysemy. When 2010F is specified, the edit processing unit 202 sets all “Suzuki” subordinate to 2010F to the same word ID, and sets a polysemy in relation to Suzuki D. Then, the synonyms described above for 2010F and Suzuki C are set. By doing so, the same word ID is given to Suzuki A, B, and C, and a different word ID is given only to Suzuki D, so that a new hierarchical structure can be constructed in consideration of polysemy. Compared with the first method, the operation for setting a polysemy can be simplified.
第3の方法として、利用者が鈴木Dと根ノード(ルートとする)Fを指定すると共に、多義語の設定をする。編集処理部202は、直接指定されている鈴木Dを除く配下の全ての「鈴木」を同一の単語IDにすると共に、直接指定された鈴木Dとの関係で多義語の設定を行う。そうすることで、鈴木A、B、Cには同じ単語IDが付与され、鈴木Dにのみ異なる単語IDが付与され、多義語を考慮した新階層構造を構築することができる。第2の方法に比べて、さらに簡素化した操作で多義語を設定することができる。 As a third method, the user designates Suzuki D and root node (root) F and sets a polysemy. The edit processing unit 202 sets all “Suzuki” subordinates except the directly designated Suzuki D to the same word ID, and sets a polysemy in relation to the directly designated Suzuki D. By doing so, the same word ID is given to Suzuki A, B, and C, and a different word ID is given only to Suzuki D, so that a new hierarchical structure can be constructed in consideration of polysemy. Compared to the second method, it is possible to set polysemy with a further simplified operation.
なお、第1の方法の場合は、多義語の指定の操作において、一の単語を指定した後は、その指定した単語と同一の文言の単語しか指定できないようにシステム側が制御してもよい。
以上のようなチェック処理部201、編集処理部202、表示制御部26の処理により、新階層構造を洗練することができる。
In the case of the first method, the system side may perform control so that only one word having the same wording as the designated word can be designated after designating one word in the operation for designating a polysemy.
The new hierarchical structure can be refined by the processing of the check processing unit 201, the editing processing unit 202, and the display control unit 26 as described above.
(その他の実施形態)
前記各実施形態に関して次の付記を示す。
(付記1)管理の対象となる複数の管理ファイルを格納するファイル格納手段と、前記管理ファイルと既存の旧階層構造における各ノードとを対応付けた対応情報、及び前記管理ファイルと新たに生成された新階層構造における各ノードとを対応付けた対応情報を記憶する対応情報記憶手段と、任意の一又は複数の単語からなる単語集合が入力された場合に、前記対応情報におけるノードの名称から前記入力された単語集合に含まれない単語を削除し、削除された結果名称が空になった空ノードについては当該空ノードを削除し、共通の親を有する兄弟関係のノードの中で、同一の名称となったノードを統合して前記対応
情報を再構成する再構成手段とを備え、前記再構成手段が、前記空ノードを削除する場合に、当該空ノードの子ノード及び葉ノードについては直近の先祖ノードに対応付けることを特徴とする階層構造管理装置。
(Other embodiments)
The following additional notes will be given with respect to the above embodiments.
(Supplementary Note 1) File storage means for storing a plurality of management files to be managed, correspondence information associating the management file with each node in the existing old hierarchical structure, and the management file newly generated When correspondence information storage means for storing correspondence information in association with each node in the new hierarchical structure and a word set consisting of any one or a plurality of words are input, from the name of the node in the correspondence information Delete a word that is not included in the input word set, delete the empty node whose empty name is the result of deletion, and delete the same empty node among sibling nodes that have a common parent Reconfiguring means for reconfiguring the correspondence information by integrating the nodes having names, and when the reconfiguring means deletes the empty node, Hierarchical Management and wherein the associating the nearest ancestor node for the leaf node.
(付記2)付記1に記載の階層構造管理装置において、複数の階層構造をそれぞれ異なる分類基準で形成し、当該形成された各階層構造ごとに前記全ての管理ファイルについて、当該管理ファイルと前記各階層構造におけるノードとの対応情報を記憶する対応情報記憶手段と、前記対応情報記憶手段が記憶する各階層構造を表示する表示制御手段と、前記対応情報記憶手段が記憶する前記対応情報における全てのノードの名称を構成する単語のうち、任意の一又は複数の単語からなる対象単語について、当該対象単語が含まれる階層構造以外の各候補新階層構造ごとに、当該候補新階層構造におけるノードの名称を構成する単語に前記対象単語を追加したものを単語集合として前記再構成手段の処理を順次実行し、実行した結果、再構成後に前記対象単語が1回しか出現しない候補新階層構造がある場合に、当該対象単語を抽出する対象単語抽出手段とを備え、前記表示制御手段が、前記対象単語抽出手段で抽出した対象単語について、他の単語との表示態様を異ならせて表示することを特徴とする階層構造管理装置。 (Supplementary note 2) In the hierarchical structure management apparatus according to supplementary note 1, a plurality of hierarchical structures are formed according to different classification standards, and the management file and each of the management files for each of the formed hierarchical structures Correspondence information storage means for storing correspondence information with nodes in the hierarchical structure, display control means for displaying each hierarchical structure stored in the correspondence information storage means, and all the correspondence information in the correspondence information stored in the correspondence information storage means For each target new hierarchical structure other than the hierarchical structure that includes the target word, for each target new hierarchical structure that includes the target word, among the words that constitute the node name, the name of the node in the candidate new hierarchical structure The processing of the reconstructing means is sequentially executed by adding the target word to the words constituting the word set as a word set. A target word extraction means for extracting the target word when there is a candidate new hierarchical structure in which the recording target word appears only once, and the display control means for the target word extracted by the target word extraction means, A hierarchical structure management apparatus, characterized in that the display mode is different from that of other words.
(付記3)付記2に記載の階層構造管理装置において、前記表示制御手段が、前記任意の一の対象単語が1回しか出現しない候補新階層構造を示す情報を、前記任意の一の対象単語と対応付けて表示することを特徴とする階層構造管理装置。 (Supplementary note 3) In the hierarchical structure management device according to supplementary note 2, the display control means uses the arbitrary one target word to indicate information indicating a candidate new hierarchical structure in which the arbitrary one target word appears only once. A hierarchical structure management apparatus characterized by being displayed in association with each other.
(付記4)付記1に記載の階層構造管理装置において、複数の階層構造をそれぞれ異なる分類基準で形成し、当該形成された各階層構造ごとに前記全ての管理ファイルについて、当該管理ファイルと前記各階層構造におけるノードとの対応情報を記憶する対応情報記憶手段と、前記対応情報記憶手段が記憶する各階層構造を表示する表示制御手段とを備え、前記表示制御手段が、前記表示している各階層構造において、同一の単語が同一の階層構造に出現している場合に、当該同一の単語を他の単語と区別して表示することを特徴とする階層構造管理装置。 (Supplementary note 4) In the hierarchical structure management apparatus according to supplementary note 1, a plurality of hierarchical structures are formed with different classification criteria, and the management file and each of the management files for each of the formed hierarchical structures Corresponding information storage means for storing correspondence information with nodes in a hierarchical structure; and display control means for displaying each hierarchical structure stored in the correspondence information storage means, wherein the display control means A hierarchical structure management apparatus, wherein, in a hierarchical structure, when the same word appears in the same hierarchical structure, the same word is displayed separately from other words.
(付記5)付記1に記載の階層構造管理装置において、複数の階層構造をそれぞれ異なる分類基準で形成し、当該形成された各階層構造ごとに前記全ての管理ファイルについて、当該管理ファイルと前記各階層構造におけるノードとの対応情報を記憶する対応情報記憶手段と、前記対応情報記憶手段が記憶する各階層構造を表示する表示制御手段と、前記表示された任意の一の階層構造のノードの名称を構成する任意の一又は複数の単語からなる指定単語、及び当該指定単語を移動させる移動先階層構造が指定された場合に、前記移動先階層構造を構成する単語に、前記指定単語を追加したものを単語集合として前記再構成手段の処理を実行すると共に、前記指定単語が含まれる階層構造におけるノードの名称を構成する単語から、前記指定単語を除外したものを単語集合として前記再構成手段の処理を実行して、階層構造間の単語の移動を制御する移動制御手段とを備えることを特徴とする階層構造管理装置。 (Supplementary Note 5) In the hierarchical structure management device according to Supplementary Note 1, a plurality of hierarchical structures are formed with different classification criteria, and the management file and each of the management files for each of the formed hierarchical structures Correspondence information storage means for storing correspondence information with nodes in the hierarchical structure, display control means for displaying each hierarchical structure stored in the correspondence information storage means, and names of the nodes of any one of the displayed hierarchical structures The specified word is added to the words constituting the destination hierarchical structure when the designated word consisting of any one or more words constituting the destination and the destination hierarchical structure for moving the designated word are designated The processing of the reconstructing means is executed as a word set, and the designation is made from the words constituting the names of the nodes in the hierarchical structure including the designated word. Word said by performing the processing of reconstruction means those excluded as word set the hierarchy management apparatus characterized by comprising a movement control means for controlling the movement of words between hierarchy.
(付記6)付記1に記載の階層構造管理装置において、複数の階層構造をそれぞれ異なる分類基準で形成し、当該形成された各階層構造ごとに前記全ての管理ファイルについて、当該管理ファイルと前記各階層構造におけるノードとの対応情報を記憶する対応情報記憶手段と、前記対応情報記憶手段が記憶する各階層構造を表示する表示制御手段と、前記表示された任意の一の階層構造のノードの名称を構成する任意の一又は複数の単語からなる指定単語、及び当該指定された指定単語を削除する削除指示情報が入力された場合に、前記入力された指定単語が含まれる階層構造におけるノードの名称を構成する単語から、前記指定単語を除外したものを単語集合として前記再構成手段の処理を実行し、階層構造からの単語の削除を制御する削除制御手段とを備えることを特徴とする階層構造管理装置
。
(Supplementary note 6) In the hierarchical structure management device according to supplementary note 1, a plurality of hierarchical structures are formed according to different classification criteria, and the management file and each of the management files are defined for each of the formed hierarchical structures. Correspondence information storage means for storing correspondence information with nodes in the hierarchical structure, display control means for displaying each hierarchical structure stored in the correspondence information storage means, and names of the nodes of any one of the displayed hierarchical structures When a specified word consisting of any one or a plurality of words that constitutes and deletion instruction information that deletes the specified word is input, the name of the node in the hierarchical structure that includes the input specified word The processing of the reconstructing means is executed as a word set from the words constituting the word excluding the designated word, and the deletion for controlling the deletion of the word from the hierarchical structure is controlled. Hierarchical Management device characterized by a control unit.
(付記7)付記1に記載の階層構造管理装置において、複数の階層構造をそれぞれ異なる分類基準で形成し、当該形成された各階層構造ごとに前記全ての管理ファイルについて、当該管理ファイルと前記各階層構造におけるノードとの対応情報を記憶する対応情報記憶手段と、前記対応情報記憶手段が記憶する各階層構造を表示する表示制御手段と、前記表示された階層構造のノードの名称を構成する単語が複数指定され、当該指定された指定単語を同義語とする指示情報が入力された場合に、前記指定単語を任意の一の単語に統一、又は前記指定単語を示す情報を一の情報に統一して、前記再構成手段の処理を実行し、同義語の制御を行う同義語制御手段とを備えることを特徴とする階層構造管理装置。 (Supplementary note 7) In the hierarchical structure management device according to supplementary note 1, a plurality of hierarchical structures are formed according to different classification criteria, and the management file and each of the management files are defined for each of the formed hierarchical structures. Correspondence information storage means for storing correspondence information with nodes in the hierarchical structure, display control means for displaying each hierarchical structure stored in the correspondence information storage means, and words constituting names of the nodes of the displayed hierarchical structure Is specified, and the specified information is unified to any one word, or the information indicating the specified word is unified to one information, when the instruction information having the designated designated word as a synonym is input And a synonym control unit that executes processing of the reconfiguration unit and controls synonyms.
(付記8)付記1に記載の階層構造管理装置において、前記管理ファイルの名称、及び前記旧階層構造における各ノードの名称を形態素解析により分割して単語情報を作成し、当該単語情報における各単語に、当該単語を示す単語IDを割り振る単語情報生成手段と、前記旧対応情報記憶手段に記憶された対応情報を表示する旧対応情報表示制御手段と、前記表示された対応情報における階層構造のノードの名称を構成する単語のうち、同一名称の単語が複数指定されると共に、当該指定された名称の単語が異なる意味を持つ単語であることを示す情報が入力された場合に、前記指定された同一名称の単語の各単語IDを異ならせて多義語の制御を行う多義語制御手段とを備えることを特徴とする階層構造管理装置。 (Supplementary note 8) In the hierarchical structure management apparatus according to supplementary note 1, the name of the management file and the name of each node in the old hierarchical structure are divided by morphological analysis to create word information, and each word in the word information A word information generation means for assigning a word ID indicating the word, an old correspondence information display control means for displaying the correspondence information stored in the old correspondence information storage means, and a node of a hierarchical structure in the displayed correspondence information When a plurality of words having the same name are designated and information indicating that the designated name is a word having a different meaning is input, the designated name is designated. A hierarchical structure management device, comprising: a polysemy control means for controlling polysemy by differentiating each word ID of a word having the same name.
以上の前記各実施形態により本発明を説明したが、本発明の技術的範囲は実施形態に記載の範囲には限定されず、これら各実施形態に多様な変更又は改良を加えることが可能である。そして、かような変更又は改良を加えた実施の形態も本発明の技術的範囲に含まれる。このことは、特許請求の範囲及び課題を解決する手段からも明らかなことである。 Although the present invention has been described with the above embodiments, the technical scope of the present invention is not limited to the scope described in the embodiments, and various modifications or improvements can be added to these embodiments. . And embodiment which added such a change or improvement is also contained in the technical scope of the present invention. This is apparent from the claims and the means for solving the problems.
1 階層構造生成装置
11 CPU
12 RAM
13 ROM
14 HD
15 通信I/F
16 入出力I/F
21 再構成処理部
22 単語情報生成部
23 第1階層構造生成部
24 第n階層構造生成部
25 対応情報生成部
26 表示制御部
27 管理ファイル
28 対応情報部
29 表示画面
201 チェック処理部
202 編集処理部
1 Hierarchical Structure Generation Device 11 CPU
12 RAM
13 ROM
14 HD
15 Communication I / F
16 Input / output I / F
21 Reconfiguration Processing Unit 22 Word Information Generation Unit 23 First Hierarchical Structure Generation Unit 24 nth Hierarchical Structure Generation Unit 25 Corresponding Information Generation Unit 26 Display Control Unit 27 Management File 28 Corresponding Information Unit 29 Display Screen 201 Check Processing Unit 202 Editing Process Part
Claims (13)
前記管理ファイルと既存の旧階層構造における各ノードとを対応付けた対応情報、及び前記管理ファイルと新たに生成された新階層構造における各ノードとを対応付けた対応情報を記憶する対応情報記憶手段と、
任意の一又は複数の単語からなる単語集合が入力された場合に、前記対応情報におけるノードの名称から前記入力された単語集合に含まれない単語を削除し、削除された結果名称が空になった空ノードについては当該空ノードを削除し、共通の親を有する兄弟関係のノードの中で、同一の名称となったノードを統合して前記対応情報を再構成する再構成手段とを備え、
前記再構成手段が、前記空ノードを削除する場合に、当該空ノードの子ノード及び葉ノードについては直近の先祖ノードに対応付けることを特徴とする階層構造管理装置。 A file storage means for storing a plurality of management files to be managed;
Correspondence information storage means for storing correspondence information in which the management file is associated with each node in the existing old hierarchical structure, and correspondence information in which the management file is associated with each node in the newly generated new hierarchical structure When,
When a word set consisting of one or more arbitrary words is input, words not included in the input word set are deleted from the names of the nodes in the correspondence information, and the deleted result name becomes empty The empty node is deleted, and among the sibling nodes having a common parent, reconstructing means for reconfiguring the correspondence information by integrating the nodes having the same name,
When the reconfiguration unit deletes the empty node, the child node and the leaf node of the empty node are associated with the nearest ancestor node.
前記管理ファイルの名称、及び前記旧階層構造における各ノードの名称を形態素解析により分割して単語情報を作成する単語情報生成手段と、
前記旧階層構造における全てのノードに関する前記単語情報について、階層レベルごとに、前記ノードの名称に重複して出現する重複単語を抽出すると共に、当該重複単語が抽出された場合に、前記単語情報のうち前記重複単語以外の単語集合について、前記再構成手段の処理を実行し、全ての階層レベルについて前記重複単語の抽出、及び前記再構成手段の処理が実行された後に最終的に残ったノードとファイルとの対応情報を第1の新階層構造として決定する第1階層構造決定手段を備えることを特徴とする階層構造管理装置。 In the hierarchical structure management apparatus according to claim 1,
A word information generating means for dividing the name of the management file and the name of each node in the old hierarchical structure by morphological analysis to create word information;
For the word information related to all the nodes in the old hierarchical structure, for each hierarchical level, a duplicate word that appears redundantly in the name of the node is extracted, and when the duplicate word is extracted, the word information Among the word sets other than the duplicate word, the process of the reconstruction means is executed, and the node that finally remains after the extraction of the duplicate word and the process of the reconstruction means are executed for all hierarchical levels A hierarchical structure management apparatus comprising first hierarchical structure determining means for determining correspondence information with a file as a first new hierarchical structure.
前記第1階層構造決定手段で抽出された任意の一の重複単語について、前記第1の新階層構造を除く他の新階層構造がない場合は、その任意の一の重複単語のみを単語集合として、前記再構成手段の処理を実行して得られる対応情報を第2以降の他の新階層構造として決定し、
前記第1の新階層構造を除く他の新階層構造がある場合は、当該他の新階層構造における各ノードの名称を構成する単語集合に、当該他の新階層構造ごとに前記任意の一の重複単語を追加したものを単語集合として前記再構成手段の処理を順次実行し、実行した結果再構成された階層構造に、前記追加した重複単語が1回しか出現しない場合には、当該再構成手段の処理により得られた対応情報を第2以降の他の新階層構造として決定し、
前記追加した重複単語が複数回出現する場合には、当該追加した重複単語のみを単語集合として、前記再構成手段の処理を実行して得られる対応情報を第2以降の他の新階層構造として決定する処理を、前記全ての重複単語について実行して第2以降の新階層構造を決定する第n階層構造決定手段を備えることを特徴とする階層構造管理装置。 In the hierarchical structure management apparatus according to claim 2,
If there is no other new hierarchical structure except the first new hierarchical structure for any one duplicated word extracted by the first hierarchical structure determining means, only that arbitrary duplicated word is used as a word set. , Determining the correspondence information obtained by executing the processing of the reconfiguration means as another new hierarchical structure after the second,
When there is another new hierarchical structure excluding the first new hierarchical structure, the arbitrary one of the other new hierarchical structures is added to the word set constituting the name of each node in the other new hierarchical structure. The processing of the reconstructing means is sequentially executed with a word set added with duplicate words, and when the added duplicate word appears only once in the reconstructed hierarchical structure as a result of the execution, the reconstruction is performed The correspondence information obtained by the processing of the means is determined as another new hierarchical structure after the second,
When the added duplicate word appears a plurality of times, only the added duplicate word is taken as a word set, and correspondence information obtained by executing the processing of the reconstruction means is taken as another new hierarchical structure after the second A hierarchical structure management apparatus comprising n-th hierarchical structure determining means for determining a second and subsequent new hierarchical structures by executing a process for determining all the duplicate words.
前記第n階層構造決定手段が、
前記任意の一の重複単語を、前記他の新階層構造における各ノードの名称を構成する単語集合に追加したものを単語集合として、前記再構成手段の処理を順次実行した場合に、実行した結果再構成された階層構造に、前記追加した任意の一の重複単語が1回しか出現しない前記他の新階層構造が複数あるときは、当該複数の他の新階層構造における各根ノードに対応付けられるファイルの数を比較し、当該ファイルの数が最小となる前記他の新階層構造に、前記任意の一の重複単語を追加して得られた対応情報を新階層構造として決定することを特徴とする階層構造管理装置。 In the hierarchical structure management apparatus according to claim 3,
The n-th hierarchical structure determining means is
Results obtained when the processing of the reconstructing means is sequentially executed by adding the arbitrary one duplicate word to the word set constituting the name of each node in the other new hierarchical structure as a word set When there are a plurality of other new hierarchical structures in which the added arbitrary duplicate word appears only once in the reconstructed hierarchical structure, it is associated with each root node in the plurality of other new hierarchical structures The number of files to be compared is compared, and correspondence information obtained by adding the arbitrary one duplicate word to the other new hierarchical structure in which the number of the files is minimized is determined as a new hierarchical structure. Hierarchical structure management device.
前記第n階層構造決定手段が、
前記複数の他の新階層構造における根ノードに対応付けられるファイルの数を比較した場合に、最小となるファイル数が同じとなる前記他の新階層構造が複数あるときには、前記追加された重複単語を保留単語として記憶し、当該保留単語となった重複単語以外の他の重複単語について、前記再構成手段の処理が終わった後に、再度保留単語について前記再構成手段の処理を実行して得られた対応情報を新階層構造として決定することを特徴とする階層構造管理装置。 In the hierarchical structure management apparatus according to claim 4,
The n-th hierarchical structure determining means is
When there are a plurality of other new hierarchical structures having the same minimum number of files when comparing the number of files associated with the root node in the plurality of other new hierarchical structures, the added duplicate word Is obtained as a reserved word, and after the processing of the reconstructing means is completed for other duplicate words other than the duplicate word that has become the reserved word, the processing of the reconfiguring means is again executed for the reserved word. A hierarchical structure management device characterized in that the correspondence information is determined as a new hierarchical structure.
前記第1階層構造決定手段が決定した第1の新階層構造、及び前記第n階層構造決定手段が決定した一又は複数の新階層構造を表示する表示制御手段と、
前記第1の新階層構造及び他の新階層構造における全てのノードの名称を構成する単語のうち、任意の一又は複数の単語からなる対象単語について、当該対象単語が含まれる新階層構造以外の各候補新階層構造に対して、当該候補新階層構造におけるノードの名称を構成する単語に前記対象単語を追加したものを単語集合として前記再構成手段の処理を順次実行し、実行した結果、再構成後に前記対象単語が1回しか出現しない候補新階層構造がある場合に、当該対象単語を抽出する対象単語抽出手段とを備え、
前記表示制御手段が、前記対象単語抽出手段で抽出した対象単語について、他の単語との表示態様を異ならせて表示することを特徴とする階層構造管理装置。 In the hierarchical structure management device according to any one of claims 3 to 5,
Display control means for displaying the first new hierarchical structure determined by the first hierarchical structure determining means and the one or more new hierarchical structures determined by the nth hierarchical structure determining means;
Among the words constituting the names of all nodes in the first new hierarchical structure and the other new hierarchical structures, the target word consisting of any one or more words other than the new hierarchical structure including the target word For each candidate new hierarchical structure, the processing of the reconstruction means is sequentially executed by adding the target word to the word constituting the name of the node in the candidate new hierarchical structure as a word set. When there is a candidate new hierarchical structure in which the target word appears only once after configuration, the target word extraction means for extracting the target word,
The hierarchical structure management apparatus, wherein the display control means displays the target word extracted by the target word extraction means in a different display mode from other words.
前記表示制御手段が、前記対象単語が1回しか出現しない候補新階層構造を示す情報を、前記対象単語と対応付けて表示することを特徴とする階層構造管理装置。 In the hierarchical structure management apparatus according to claim 6,
The hierarchical structure management apparatus, wherein the display control means displays information indicating a candidate new hierarchical structure in which the target word appears only once in association with the target word.
前記第1階層構造決定手段が決定した第1の新階層構造、及び前記第n階層構造決定手段が決定した一又は複数の新階層構造を表示する表示制御手段を備え、
前記表示制御手段が、
前記新階層構造において、同一の単語が同一の階層構造に出現している場合に、当該同一の単語を他の単語と区別して表示することを特徴とする階層構造管理装置。 The hierarchical structure management device according to any one of claims 3 to 7,
Display control means for displaying the first new hierarchical structure determined by the first hierarchical structure determining means and one or more new hierarchical structures determined by the nth hierarchical structure determining means;
The display control means is
In the new hierarchical structure, when the same word appears in the same hierarchical structure, the same word is distinguished from other words and displayed.
前記第1階層構造決定手段が決定した第1の新階層構造、及び前記第n階層構造決定手段が決定した一又は複数の新階層構造を表示する表示制御手段と、
前記表示された任意の一の新階層構造のノードの名称を構成する任意の一又は複数の単語からなる指定単語、及び当該指定単語を移動させる移動先新階層構造が指定された場合に、
前記移動先新階層構造を構成する単語に、前記指定単語を追加したものを単語集合として前記再構成手段の処理を実行すると共に、前記指定単語が含まれる新階層構造におけるノードの名称を構成する単語から、前記指定単語を除外したものを単語集合として前記再構成手段の処理を実行して、新階層構造間の単語の移動を制御する移動制御手段とを備えることを特徴とする階層構造管理装置。 The hierarchical structure management device according to any one of claims 3 to 8,
Display control means for displaying the first new hierarchical structure determined by the first hierarchical structure determining means and the one or more new hierarchical structures determined by the nth hierarchical structure determining means;
When a designated word consisting of any one or a plurality of words constituting the name of the node of any one of the displayed new hierarchical structures and a destination new hierarchical structure for moving the designated words are designated,
The processing of the reconstructing means is executed with the word constituting the destination new hierarchical structure added with the designated word as a word set, and the name of the node in the new hierarchical structure including the designated word is constructed Hierarchical structure management comprising: a movement control means for controlling the movement of words between new hierarchical structures by executing the processing of the reconstructing means as a set of words excluding the designated word from words apparatus.
前記第1階層構造決定手段が決定した第1の新階層構造、及び前記第n階層構造決定手段が決定した一又は複数の新階層構造を表示する表示制御手段と、
前記表示された任意の一の新階層構造のノードの名称を構成する任意の一又は複数の単語からなる指定単語、及び当該指定単語を削除する削除指示情報が入力された場合に、前記入力された指定単語が含まれる新階層構造におけるノードの名称を構成する単語から、前記指定単語を除外したものを単語集合として前記再構成手段の処理を実行し、新階層構
造からの単語の削除を制御する削除制御手段とを備えることを特徴とする階層構造管理装置。 The hierarchical structure management device according to any one of claims 3 to 9,
Display control means for displaying the first new hierarchical structure determined by the first hierarchical structure determining means and the one or more new hierarchical structures determined by the nth hierarchical structure determining means;
When a designated word consisting of any one or a plurality of words constituting the name of any one of the displayed new hierarchical structure nodes and deletion instruction information for deleting the designated word are inputted, Control the deletion of words from the new hierarchical structure by executing the processing of the reconstruction means as a set of words excluding the designated words from the words constituting the node names in the new hierarchical structure including the designated words A hierarchical structure management apparatus comprising: deletion control means for performing
前記第1階層構造決定手段が決定した第1の新階層構造、及び前記第n階層構造決定手段が決定した一又は複数の新階層構造を表示する表示制御手段と、
前記表示された新階層構造のノードの名称を構成する単語が複数指定され、当該指定された指定単語を同義語とする指示情報が入力された場合に、前記指定単語を任意の一の単語に統一、又は前記指定単語を示す情報を一の情報に統一して、前記再構成手段の処理を実行し、同義語の制御を行う同義語制御手段とを備えることを特徴とする階層構造管理装置。 The hierarchical structure management device according to any one of claims 3 to 10,
Display control means for displaying the first new hierarchical structure determined by the first hierarchical structure determining means and the one or more new hierarchical structures determined by the nth hierarchical structure determining means;
When a plurality of words constituting the name of the displayed node of the new hierarchical structure are designated and instruction information having the designated designated word as a synonym is input, the designated word is changed to any one word. A hierarchical structure management device comprising: synonym control means for unifying or unifying information indicating the designated word into one information, executing processing of the reconstruction means, and controlling synonyms .
前記管理ファイルの名称、及び前記旧階層構造における各ノードの名称を形態素解析により分割して単語情報を作成し、当該単語情報における各単語に、当該単語を示す単語IDを割り振る単語情報生成手段と、
前記対応情報記憶手段に記憶された対応情報を表示する旧対応情報表示制御手段と、
前記表示された対応情報における階層構造のノードの名称を構成する単語のうち、同一名称の単語が複数指定されると共に、当該指定された名称の単語が異なる意味を持つ単語であることを示す情報が入力された場合に、前記指定された同一名称の単語の各単語IDを異ならせて多義語の制御を行う多義語制御手段とを備えることを特徴とする階層構造管理装置。
The hierarchical structure management device according to any one of claims 3 to 10,
A word information generating means for creating word information by dividing the name of the management file and the name of each node in the old hierarchical structure by morphological analysis, and allocating a word ID indicating the word to each word in the word information; ,
And the old correspondence information display control means for displaying the corresponding information stored prior SL-enabled information storage means,
Information indicating that a plurality of words having the same name are designated among the words constituting the names of the nodes of the hierarchical structure in the displayed correspondence information, and the words having the designated names are words having different meanings. A hierarchical structure management device, comprising: a polysemy control means for controlling polysemy by differentiating each word ID of the designated word having the same name.
複数の階層構造をそれぞれ異なる分類基準で形成し、当該形成された各階層構造ごとに前記全ての管理ファイルについて、当該管理ファイルと前記各階層構造におけるノードとの対応情報を記憶する対応情報記憶手段と、
前記対応情報記憶手段が記憶する各階層構造を表示する表示制御手段と、
前記対応情報記憶手段が記憶する前記対応情報における全てのノードの名称を構成する単語のうち、任意の一又は複数の単語からなる対象単語について、当該対象単語が含まれる階層構造以外の各候補新階層構造に対して、当該候補新階層構造におけるノードの名称を構成する単語に前記対象単語を追加したものを単語集合として前記再構成手段の処理を順次実行し、実行した結果、再構成後に前記対象単語が1回しか出現しない候補新階層構造がある場合に、当該対象単語を抽出する対象単語抽出手段とを備え、
前記表示制御手段が、前記対象単語抽出手段で抽出した対象単語について、他の単語との表示態様を異ならせて表示することを特徴とする階層構造管理装置。 In the hierarchical structure management apparatus according to claim 1,
Corresponding information storage means for forming a plurality of hierarchical structures with different classification criteria and storing correspondence information between the management files and nodes in each hierarchical structure for all the management files for each of the formed hierarchical structures When,
Display control means for displaying each hierarchical structure stored in the correspondence information storage means;
Among the words constituting the names of all the nodes in the correspondence information stored in the correspondence information storage means, for each candidate word composed of any one or more words, each candidate new one other than the hierarchical structure including the target word For the hierarchical structure, the processing of the reconstructing means is sequentially executed as a word set by adding the target word to the word constituting the name of the node in the candidate new hierarchical structure. A target word extraction unit that extracts the target word when there is a candidate new hierarchical structure in which the target word appears only once;
The hierarchical structure management apparatus, wherein the display control means displays the target word extracted by the target word extraction means in a different display mode from other words.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2010198934A JP5544571B2 (en) | 2010-09-06 | 2010-09-06 | Hierarchical structure management apparatus, method thereof, and program |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2010198934A JP5544571B2 (en) | 2010-09-06 | 2010-09-06 | Hierarchical structure management apparatus, method thereof, and program |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2012058835A JP2012058835A (en) | 2012-03-22 |
| JP5544571B2 true JP5544571B2 (en) | 2014-07-09 |
Family
ID=46055906
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2010198934A Expired - Fee Related JP5544571B2 (en) | 2010-09-06 | 2010-09-06 | Hierarchical structure management apparatus, method thereof, and program |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP5544571B2 (en) |
Families Citing this family (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP6043899B2 (en) * | 2012-04-26 | 2016-12-14 | 野田 正嗣 | Information management apparatus and information retrieval method |
| JP6102594B2 (en) | 2013-07-16 | 2017-03-29 | 富士通株式会社 | Data output method and data output program |
| JP6136685B2 (en) | 2013-07-16 | 2017-05-31 | 富士通株式会社 | Data extraction method and data extraction program |
| JP6103314B2 (en) * | 2014-09-02 | 2017-03-29 | 野田 正嗣 | Information management apparatus and file management method |
| JP6251860B2 (en) * | 2015-02-19 | 2017-12-27 | 野田 正嗣 | Information management apparatus and file management method |
| WO2016190444A1 (en) * | 2015-05-28 | 2016-12-01 | 正嗣 野田 | Information management device, and file management method |
| JP2016197427A (en) * | 2016-06-23 | 2016-11-24 | 野田 正嗣 | Information management apparatus and information retrieval method |
| JP6994138B2 (en) * | 2016-08-22 | 2022-01-14 | 野田 正嗣 | Information management device and file management method |
| JP7421282B2 (en) * | 2019-08-05 | 2024-01-24 | 野田 正嗣 | Information management device and file management method |
Family Cites Families (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH11306187A (en) * | 1998-04-20 | 1999-11-05 | Nippon Telegr & Teleph Corp <Ntt> | Presentation processing method and apparatus for presenting search result of document with category |
| JP2009193602A (en) * | 2009-06-02 | 2009-08-27 | Nec Corp | Information retrieval system, information retrieval method, and information retrieval program |
-
2010
- 2010-09-06 JP JP2010198934A patent/JP5544571B2/en not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JP2012058835A (en) | 2012-03-22 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP5544571B2 (en) | Hierarchical structure management apparatus, method thereof, and program | |
| US10452768B2 (en) | Managing source annotation metadata | |
| Cole et al. | Cem–a conceptual email manager | |
| JP6246279B2 (en) | System, method and computer program for consumer-defined information architecture | |
| JP5626733B2 (en) | Personal information anonymization apparatus and method | |
| JP6132698B2 (en) | Tabular multidimensional data conversion method and apparatus | |
| JP2010009469A (en) | File management device | |
| CN102456071A (en) | File management apparatus and file management method | |
| CN104412227A (en) | Query-based software system design representation | |
| US11429782B2 (en) | Document retrieval and processing from online databases using thumbnail image indexing | |
| CN101142574A (en) | Keyword Manager | |
| Laclavík et al. | Emails as graph: relation discovery in email archive | |
| Eck et al. | A semantic file system for integrated product data management | |
| US20050152362A1 (en) | Data classification management system and method thereof | |
| Dattolo et al. | VisualBib: a novel Web app for supporting researchers in the creation, visualization and sharing of bibliographies | |
| Huang et al. | Mapping the landscape of digital cultural heritage research: a quantitative and visual bibliometric study | |
| JP4604168B1 (en) | File management apparatus, method thereof, and program | |
| JPWO2006030485A1 (en) | Information management apparatus, method, and program | |
| CN117786179A (en) | A scientific research results retrieval method based on the key attributes of high-level talents | |
| US20090193053A1 (en) | Information management system | |
| CN108205564B (en) | Knowledge system construction method and system | |
| JP5615593B2 (en) | Electronic document management apparatus, display method, display program, and recording medium | |
| McGee et al. | Towards visual analytics of multilayer graphs for digital cultural heritage | |
| US20060224975A1 (en) | System for creating a graphical application interface with a browser | |
| Ziri et al. | Cultural heritage sites holistic documentation through semantic web technologies |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130805 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140124 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140128 |
|
| A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140317 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140415 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140418 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 5544571 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| LAPS | Cancellation because of no payment of annual fees |