JP4772022B2 - Data management system and data management method - Google Patents
Data management system and data management method Download PDFInfo
- Publication number
- JP4772022B2 JP4772022B2 JP2007260366A JP2007260366A JP4772022B2 JP 4772022 B2 JP4772022 B2 JP 4772022B2 JP 2007260366 A JP2007260366 A JP 2007260366A JP 2007260366 A JP2007260366 A JP 2007260366A JP 4772022 B2 JP4772022 B2 JP 4772022B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- group
- importance
- personal computer
- keyword
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 73
- 238000013523 data management Methods 0.000 title claims description 25
- 238000007726 management method Methods 0.000 claims description 44
- 238000004458 analytical method Methods 0.000 claims description 9
- 238000004891 communication Methods 0.000 claims description 9
- 230000008520 organization Effects 0.000 claims description 6
- 239000000284 extract Substances 0.000 claims description 4
- 238000012545 processing Methods 0.000 description 55
- 230000002776 aggregation Effects 0.000 description 7
- 238000004220 aggregation Methods 0.000 description 7
- 238000012015 optical character recognition Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Images
Landscapes
- Storage Device Security (AREA)
Description
この発明は、電子化されたデータが記憶媒体に書き込まれて持ち出される際に、このデータを管理するデータ管理システムおよびデータ管理方法に関する。 The present invention relates to a data management system and a data management method for managing data when the digitized data is written on a storage medium and taken out.
電子化されたデータを記憶する記憶媒体として、USBメモリ等の小型記憶媒体が広く普及している。こうした小型記憶媒体を用いると、データの持ち出しが容易であるために、データの持ち出しを管理する必要がある。特に、データが機密情報や業務情報をデータ化したものである場合には、各種の重要情報がデータに含まれているので、データの持ち出し管理は企業等において特に重要である。 As a storage medium for storing digitized data, a small storage medium such as a USB memory is widely used. When such a small storage medium is used, it is easy to take out data, so it is necessary to manage the taking out of data. In particular, when the data is confidential information or business information converted into data, various important information is included in the data. Therefore, data take-out management is particularly important in companies and the like.
このために、機密情報であることを示す機密フラグを用いて、データを管理するシステムがある(例えば、特許文献1参照。)。このシステムでは、あらかじめデータに対して、データの内容が機密情報であることを示す機密フラグを関連付けて保存している。そして、データが読み出された場合に、関連付けされた機密フラグを用いて、データが機密情報に該当するかどうかを判定し、機密情報である場合に、データを読み出した端末のID(IDentification)を記憶して、データを管理している。
ところで、先に述べたシステムには次の課題がある。つまり、このシステムでは、各データに対してあらかじめ機密フラグを関連付けておく必要がある。つまり、事前にデータが機密情報かどうかを判断して、データを振り分ける必要がある。しかし、企業等で使用されるデータは更新されることがあり、こうした場合に、データが機密情報になるときや、その逆のときもある。特に、データが更新された場合に機密情報となったときに、機密フラグの変更がないと、データが機密扱いにはならない。つまり、機密フラグを事前に振り分けておくと、データの管理上、問題が発生する。 By the way, the system described above has the following problems. That is, in this system, it is necessary to associate a confidential flag with each data in advance. That is, it is necessary to determine whether the data is confidential information in advance and distribute the data. However, data used in companies and the like may be updated, and in such cases, the data may become confidential information and vice versa. In particular, if the confidential information is changed when the data is updated, the data will not be classified unless the confidential flag is changed. In other words, if the secret flag is assigned in advance, a problem occurs in data management.
この発明の目的は、前記の課題を解決し、データが機密情報かどうかを事前に振り分けることを不要にして、データの持ち出しを管理する、データ管理システムおよびデータ管理方法を提供することにある。 An object of the present invention is to provide a data management system and a data management method for solving the above-mentioned problems and managing the taking-out of data without making it necessary to sort out whether the data is confidential information in advance.
前記の課題を解決するために、請求項1の発明は、データの書き込みができる記憶媒体を利用可能であると共に組織体の各グループで使用されるパーソナルコンピュータと、該パーソナルコンピュータが取り扱うデータの中の機密情報を管理する管理サーバと、機密情報の管理に必要とするデータとして、該グループ毎に重要度が付加されたグループ別重要度データを記憶するデータベースサーバとがデータ通信可能に接続されているデータ管理システムであって、前記管理サーバは、所定の解析方法によって、収集した各文書に共通して現れる単語を低く重み付けを行い、特定の文書に現れる単語を高く重み付けを行い、該解析方法によって重み付けをした単語をキーワードとすると共に重みの大きさに応じて重要度を表す値を該キーワードに付加し、該キーワードと、該キーワードを使用するグループとを関連付けて機密データとして前記データベースサーバに記憶し、前記パーソナルコンピュータは、前記記憶媒体にデータを書き込むときに、該データから単語を抽出し、該単語と前記データベースサーバの機密データのキーワードとを対比して、該データが機密情報かどうかを判断し、該データが機密情報である場合に、該データに含まれるキーワードを使用するグループがあると、該キーワードをグループ別に分け、グループ毎に分けられた各キーワードの重要度を集計し、集計して得たグループ別の重要度と前記グループ別重要度データとを比較し、グループの重要度に比べて集計した重要度が大きい場合に、該グループの機密情報に該データが該当すると判断する、ことを特徴とするデータ管理システムである。
In order to solve the above-mentioned problems, the invention of
請求項1の発明では、機密情報を表すキーワードを機密データとして、あらかじめデータベースサーバが記憶している。こうした状態のときに、USBメモリなどの記憶媒体にデータを書き込む際に、パーソナルコンピュータは、書き込まれるデータから単語を抽出する。この後、パーソナルコンピュータは、データから抽出した単語と機密データのキーワードとを対比して、データが機密情報かどうかを判断する。
In the invention of
請求項2の発明は、請求項1に記載のデータ管理システムにおいて、前記パーソナルコンピュータは、前記記憶媒体に書き込むデータが機密情報であるとき、該データのログ情報を前記データベースサーバに送り、前記データベースサーバは、前記パーソナルコンピュータからログ情報を受け取ると、該ログ情報を記録しておくことを特徴とする。 According to a second aspect of the present invention, in the data management system according to the first aspect, when the data written to the storage medium is confidential information, the personal computer sends log information of the data to the database server , and the database When the server receives log information from the personal computer, the server records the log information.
請求項3の発明は、請求項2に記載のデータ管理システムにおいて、前記ログ情報は、データを前記記憶媒体に書き込む実行ユーザと、該データに付けられている名称と、該データを書き込む日付けおよび時刻の少なくとも一方とからなることを特徴とする。 According to a third aspect of the present invention, in the data management system according to the second aspect, the log information includes an execution user who writes data to the storage medium, a name given to the data, and a date on which the data is written. And at least one of time.
請求項4の発明は、請求項2または3に記載のデータ管理システムにおいて、前記パーソナルコンピュータは、書き込むデータが機密情報であるとき、該データの持ち出し理由の入力を要求し、該持ち出し理由が特定の持ち出し理由であるとき、該データと該持ち出し理由とを前記ログ情報に付加することを特徴とする。 According to a fourth aspect of the present invention, in the data management system according to the second or third aspect , when the data to be written is confidential information, the personal computer requests input of the reason for taking out the data, and the reason for taking out is specified. The data and the reason for taking out are added to the log information.
請求項5の発明は、データの書き込みができる記憶媒体を利用可能であると共に組織体の各グループで使用されるパーソナルコンピュータと、該パーソナルコンピュータが取り扱うデータの中の機密情報を管理する管理サーバと、機密情報の管理に必要とするデータとして、該グループ毎に重要度が付加されたグループ別重要度データを記憶するデータベースサーバとがデータ通信可能に接続されているシステムのデータ管理方法であって、前記管理サーバにより、所定の解析方法によって、収集した各文書に共通して現れる単語を低く重み付けを行い、特定の文書に現れる単語を高く重み付けを行い、該解析方法によって重み付けをした単語をキーワードとすると共に重みの大きさに応じて重要度を表す値を該キーワードに付加し、該キーワードと、該キーワードを使用するグループとを関連付けて機密データとして前記データベースサーバに記憶し、前記パーソナルコンピュータにより、前記記憶媒体にデータを書き込むときに、該データから単語を抽出し、該単語と前記データベースサーバの機密データのキーワードとを対比して、該データが機密情報かどうかを判断し、該データが機密情報である場合に、該データに含まれるキーワードを使用するグループがあると、該キーワードをグループ別に分け、グループ毎に分けられた各キーワードの重要度を集計し、集計して得たグループ別の重要度と前記グループ別重要度データとを比較し、グループの重要度に比べて集計した重要度が大きい場合に、該グループの機密情報に該データが該当すると判断する、ことを特徴とするデータ管理方法である。 According to a fifth aspect of the present invention, there is provided a personal computer that can use a storage medium on which data can be written and is used in each group of an organization, and a management server that manages confidential information in data handled by the personal computer. A data management method for a system in which, as data necessary for management of confidential information, a database server that stores importance data for each group to which importance is added for each group is connected so that data communication is possible. The management server assigns a low weight to words commonly appearing in each collected document by a predetermined analysis method, assigns a high weight to words appearing in a specific document, and assigns words weighted by the analysis method to keywords. And a value indicating importance according to the size of the weight is added to the keyword, and the key Is stored in the database server as confidential data in association with a group that uses the keyword, and when the data is written to the storage medium by the personal computer, the word is extracted from the data, In contrast to the keyword of the confidential data of the database server, it is determined whether or not the data is confidential information. When the data is confidential information, if there is a group that uses the keyword included in the data, The keywords are divided into groups, the importance of each keyword divided for each group is aggregated, and the importance for each group obtained by aggregation is compared with the importance data for each group, and compared with the importance of the group. If aggregation degree of importance is high, it is determined that the data corresponds to the confidential information of the group, to characterized in that It is a data management method.
請求項1および請求項5の発明によれば、データを記録媒体に書き込む時点で、書き込みデータが機密情報であるかどうかを判断するので、従来のように、データが更新されたときに、データが機密情報から外れて管理されないといった、データの更新の影響を受けることを防ぐことができる。しかも、組織の各グループに応じて、持ち出しファイルを管理することができる。 According to the first and fifth aspects of the present invention, since it is determined whether or not the written data is confidential information when the data is written to the recording medium, the data is updated when the data is updated as in the prior art. Can be prevented from being affected by data updates, such as being unmanaged from confidential information. In addition, files taken out can be managed according to each group of the organization.
請求項2の発明によれば、記憶媒体に書き込むデータが機密情報であると、ログ情報をデータベースサーバに記憶するので、データが漏洩した場合、漏洩したデータの関連情報とログ情報とを照合することにより、情報の流出元を特定することを可能にする。
According to the invention of
請求項3の発明によれば、ログ情報はデータを記憶媒体に書き込む実行ユーザ、データに付けられている名称、書き込みの日時からなるので、ログ情報のデータ量を少なくして、記憶手段の負担を軽くすることができる。 According to the invention of claim 3, since the log information includes the execution user who writes the data to the storage medium, the name attached to the data, and the date and time of writing, the data amount of the log information is reduced and the load on the storage means is reduced. Can be lightened.
請求項4の発明によれば、記憶媒体に書き込むデータの持ち出し理由が所定の持ち出し理由であるとき、このデータと持ち出し理由とをログ情報に付加して記録するので、持ち出し理由毎にデータを管理することを可能にする。また、データが組織体から漏洩した場合、漏洩した内容とログ情報のデータとを照合することにより、情報の流出元を特定することを可能にする。
According to the invention of
次に、この発明の実施の形態について、図面を用いて詳しく説明する。企業内の重要情報には機密情報や業務情報などがあるが、以下の実施の形態では、企業内で扱われる機密情報を例として説明する。つまり、以下の実施の形態では、機密情報をデータ化したものを管理対象のデータとする。 Next, embodiments of the present invention will be described in detail with reference to the drawings. Important information in a company includes confidential information and business information. In the following embodiment, confidential information handled in a company will be described as an example. In other words, in the following embodiment, confidential information is converted into data as management target data.
(実施の形態1)
この実施の形態によるデータ管理システムについて、図1〜図3を用いて説明する。このデータ管理システムは、図1に示すように、企業に設けられている営業部門の各パーソナルコンピュータ(PC)11、…、総務部門の各パーソナルコンピュータ(PC)12が取り扱うデータの中で、データ化された機密情報を管理するものであり、各パーソナルコンピュータ11および各パーソナルコンピュータ12に加えて、各種データを管理する管理サーバ1と、データを記憶するデータベースサーバ2と、管理担当者によって操作される管理用パーソナルコンピュータ(PC)3とを備えている。管理サーバ1、データベースサーバ2、管理用パーソナルコンピュータ3、各パーソナルコンピュータ11および各パーソナルコンピュータ12は、ローカルエリアネットワークNWによってデータ通信可能に接続されている。
(Embodiment 1)
A data management system according to this embodiment will be described with reference to FIGS. As shown in FIG. 1, this data management system includes data among the data handled by each personal computer (PC) 11 in the sales department provided in the company, and each personal computer (PC) 12 in the general affairs department. Is managed by a person in charge of management, a
管理サーバ1は、企業内で扱われる各種のデータをデータベースサーバ2に記憶して管理する。管理サーバ1は、パーソナルコンピュータ11やパーソナルコンピュータ12から、データのログ情報を受信すると、受信したログ情報をデータベースサーバ2に記憶する。
The
また、管理サーバ1がデータベースサーバ2に記録するデータとして、社員データがある。社員データは各社員の所属などを記録したものであり、この社員データを図4に示す。この社員データには、企業内で社員を識別するための社員番号と、社員の氏名が記録されている。また、社員データには、企業内のコンピュータなどを使用する際の識別情報であるユーザID(IDentification)と、パスワードが記録されている。さらに、社員データには、社員の企業内での所属(グループ)などが記録されている。こうした社員データは、データベースサーバ2の社員DB(データベース)に記録されている。
In addition, employee data is data that the
管理サーバ1がデータベースサーバ2に記録するデータとして、機密データがある。機密データは文書の中で機密情報を特徴付ける単語をデータ化したものであり、管理サーバ1は機密データを次のようにして作成する。管理サーバ1は、パーソナルコンピュータ11、12で取り扱われる文書の中で、機密情報を含む文書を収集する。例えば、既に機密扱いなどにされている文書、図面などを含む文書、研究部門などのような特定のグループが取り扱う文書などが収集対象の文書となる。
There is confidential data as data that the
管理サーバ1は、機密情報を含む文書を収集すると、TF(Term Frequency)・IDF(Inverse Document Frequency)法などのような解析方法を用いて、各文書に含まれる単語に対して重み付けを行う。TF・IDF法は、収集した文書において、高い頻度で出てくる単語の重要度を下げ、低い頻度で出てくる単語の重要度を上げて、単語に対する重み付けを行う。これにより、収集した各文書に現れる、共通の単語の重要度は低く重み付けされ、特定の文書に現れる単語は高く重み付けされる。
When collecting documents including confidential information, the
管理サーバ1は、各文書中の単語に対して重み付けを行ってキーワードとし、各キーワードを重みの大きさによって分類する。そして、管理サーバ1は、分類したキーワードに対して重要度を表す値を付け、機密データとしてデータベースサーバ2の機密情報DB(データベース)に記憶する。データベースサーバ2に記憶される機密データを図5に示す。この機密データは、TF・IDF法によって抽出されて重みが付けられたキーワードに対して、「1」〜「5」の数値が重要度として付与されている。さらに、機密データには、キーワードが所属するグループが記録されている。つまり、各グループには特有のキーワードがある。
The
なお、管理担当者が管理用パーソナルコンピュータ3を操作して、機密データのキーワードを編集することも可能である。つまり、機密データに対してキーワードの追加や重要度の変更等も行える。 It is also possible for the manager in charge to edit the keyword of the confidential data by operating the management personal computer 3. In other words, keywords can be added to the confidential data and the importance can be changed.
管理サーバ1がデータベースサーバ2に記録するデータとして、グループ別重要度データがある。グループ別重要度データは企業内の各グループの重要度を表すものであり、このグループ別重要度データを図6に示す。このグループ別重要度データには、企業内の各部門をそれぞれのグループとし、各グループの重要度を数値で表している。こうしたグループ別重要度データは、データベースサーバ2のグループ別サーバ送信判定DB(データベース)に記録されている。
As data recorded in the
営業部門で使用されるパーソナルコンピュータ(PC)11や、総務部門で使用されるパーソナルコンピュータ(PC)12は基本的に同様であるので、パーソナルコンピュータ11を例として説明する。パーソナルコンピュータ11は、図2に示すように、USBメモリ20が利用可能なコンピュータであり、図3に示すように、データなどを伝送するバス11Aに接続されている処理部11B、記憶部11C、表示部11D、入力部11E、USBインターフェース(I/F)11F、読み取り部11Gおよび通信部11Hを備えている。
Since the personal computer (PC) 11 used in the sales department and the personal computer (PC) 12 used in the general affairs department are basically the same, the
入力部11Eはキーボードやマウスなどの入力装置であり、入力部11Eにはデータや各種の指示等が入力される。表示部11Dは、LCD(液晶ディスプレイ)などの表示装置であり、処理部11Bの制御によって、入力部11Eに入力されたデータ等を表示する。USBインターフェース11Fは、USBメモリ20を接続するためのインターフェースであり、処理部11Bの制御によって、USBメモリ20に対してデータの読み書きを行う。読み取り部11Gは、手書きの文字や印刷された文字を光学的に読み取って画像化する装置である。通信部11Hは、処理部11Bの制御によって、ローカルエリアネットワークNWを用いて、データの送受信を管理サーバ1などと行う。記憶部11Cは、パーソナルコンピュータ11のための各種のプログラムを記憶している。また、入力部11Eに入力されたデータを、処理部11Bの制御によって一時的に記憶する。
The
処理部11Bは、パーソナルコンピュータ11に関する各種の処理を行う。例えば、パーソナルコンピュータ11が起動された後、処理部11Bは、パーソナルコンピュータ11を使用状態にするために、入力部11Eに入力されたユーザIDとパスワードを記憶部11Cに記憶する。
The
また、処理部11Bは、記憶部11Cが記憶している各種のプログラムを実行する。処理部11Bが実行するプログラムには、OCR(Optical Character Reader)処理がある。OCR処理は、読み取り部11Gなどが読み取った画像から、文字を識別してテキストに変換する処理である。
Further, the
処理部11Bが実行するプログラムには、書き込み処理がある。書き込み処理は、USBインターフェース11FにUSBメモリ20が接続されたときに、実行されるプログラムであり、この書き込み処理により、USBメモリ20に対するファイル形式のデータなどの書き込みが可能になる。つまり、書き込み処理は、USBメモリ20等の小型記憶媒体用の書き込み専用のプログラムである。書き込み処理によってUSBメモリ20に書き込みが可能なデータには、文書ファイルや画像ファイルなどがある。
The program executed by the
処理部11Bが実行するプログラムには、データ判定処理がある。データ判定処理は、USBメモリ20のような小型記憶媒体にファイル等のデータを書き込む場合に、機密情報がデータの内容に含まれているかどうかを判定して管理するためのプログラムである。データ判定処理は書き込み処理が起動された後で行われる。このデータ判定処理を図7〜図11に示す。なお、小型記憶媒体に対する書き込み専用のプログラムにデータ判定処理を付加してもよい。つまり、書き込み処理とデータ判定処理とを一組として、小型記憶媒体に対する書き込み専用のプログラムとしてもよい。
The program executed by the
処理部11Bは、データ判定処理を開始すると、ファイル指定処理を行う(ステップS1)。ステップS1のファイル指定処理は図8に示す処理であり、処理部11Bは、小型記憶媒体に書き込むファイル(以下、「持ち出しファイル」という)と、持ち出しファイルの書き込み先(以下、「持ち出し先」という)とを指定するための入力画面を表示して(ステップS21)、持ち出しファイルと持ち出し先の入力待ちとなる(ステップS22)。この実施の形態では、持ち出し先がUSBメモリ20である。ステップS22の後、持ち出しファイルと持ち出し先を指定するための入力が有ると(ステップS23)、処理部11Bは、持ち出しファイルの書き込み指示の入力を待つ(ステップS24)。書き込み指示が有ると(ステップS25)、処理部11Bはファイル指定処理を終了する。なお、ステップS23で持ち出しファイルと持ち出し先を指定するための入力が無い場合、また、ステップS25で書き込み指示が無い場合、処理部11Bは処理をステップS22に戻す。
When the data determination process is started, the
ステップS1のファイル指定処理が終了すると、処理部11Bは、持ち出しファイルからテキストを抽出して(ステップS2)、テキストの有無を判断する(ステップS3)。持ち出しファイルにテキストが有ると、処理部11Bは、機密情報を表すキーワードをパターンマッチングで調べる(ステップS4)。ステップS4のパターンマッチングは、持ち出しファイルのテキストと、機密データ(図5)のキーワードとを比較して、持ち出しファイルに含まれているキーワードを見つけ出す処理である。また、処理部11Bは、ファイルを持ち出す実行ユーザ、実行日時、持ち出しファイルのファイル名をログ情報とする。実行ユーザは、例えば営業部門の担当者がパーソナルコンピュータ11の操作を開始するときに、パーソナルコンピュータ11に入力する、社員データ(図4)のユーザIDとパスワードからなる情報であり、記憶部11Cが記憶している情報である。
When the file designating process in step S1 ends, the
この後、処理部11Bは、ステップS4のパターンマッチングの結果から、持ち出しファイルが機密情報に該当するかどうかを判断する(ステップS6)。持ち出しファイルが機密情報であると、処理部11Bは、グループ化処理を行う(ステップS7)。ステップS7のグループ化処理は図9に示す処理であり、処理部11Bは、機密情報の重要度をグループ別に集計する(ステップS41)。例えば図12に示すように、テキストが「交通費」、「見積金額」といったキーワードを含む場合、処理部11Bは、機密データ(図5)を用いて、グループ別にキーワードを分ける。この後、処理部11Bは、各キーワードの重要度を集計し、グループ別の重要度を算出する。
Thereafter, the
ステップS41が終了すると、処理部11Bは、集計によって得たグループ別の重要度と、グループ別重要度データ(図6)とを比較して(ステップS42)、集計によって得たグループ別の重要度が大きいかどうかを判断する(ステップS43)。集計によって得たグループ別の重要度がグループ別重要度データ(図6)に比べて大きい場合、持ち出しファイルが機密情報であり、かつ、特定グループの機密情報に該当するとして、処理部11Bは、持ち出しファイルの中身であるファイル本体と、検出した機密情報を表すキーワードとをログ情報に付加して、ステップS5のログ情報を変更し(ステップS44)、グループ化処理を終了する。なお、ステップS43で、集計によって得たグループ別の重要度がグループ別重要度データ(図6)に比べて小さい場合、処理部11BはステップS5のログ情報を変更しないで、グループ化処理を終了する。
When step S41 is completed, the
ステップS7のグループ化処理が終了すると、処理部11Bは、持ち出し理由指定処理を行う(ステップS8)。ステップS8の持ち出し理由指定処理は図10に示す処理であり、処理部11Bは、表示部11Dを制御して、持ち出し理由選択画面を表示する(ステップS61)。この持ち出し理由選択画面には、各持ち出し理由が表示される。持ち出し理由としては、例えば「委託先へ提供」や「社外に持ち出す」などがある。ステップS61の後、処理部11Bは、持ち出し理由の選択入力を待つ(ステップS62)。選択入力が無ければ(ステップS63)、処理部11Bは処理をステップS62に戻す。
When the grouping process in step S7 ends, the
ステップS63で持ち出し理由の選択入力が有ると、処理部11Bは、選択された持ち出し理由の中で、あらかじめ指定されている特定の持ち出し理由(以下、「特定理由」という)が有るかどうかを判断する(ステップS64)。選択された持ち出し理由に特定理由が有ると、処理部11Bは、選択された持ち出し理由と、持ち出しファイルの中身であるファイル本体と、検出した機密情報を表すキーワードとをログ情報に付加して、ログ情報を変更し(ステップS65)、持ち出し理由指定処理を終了する。もし、ステップS64で、選択された持ち出し理由に特定理由が無いと、処理部11Bは、ログ情報を変更しないでグループ化処理を終了する。また、ログ情報がファイル本体と、検出した機密情報を表すキーワードとを既に含むとき、処理部11Bは、このログ情報に対して、選択された持ち出し理由だけを付加してログ情報を変更する。
If there is a selection input for the reason for take-out in step S63, the
ステップS8が終了すると、処理部11Bは、通信部11Hを制御して、ログ情報を管理サーバ1に送信する(ステップS9)。この後、処理部11Bは、USBインターフェース11Fに接続されているUSBメモリ20、つまり小型記憶媒体に持ち出しファイルを書き込み(ステップS10)、データ判定処理を終了する。
When step S8 ends, the
一方、ステップS3で、持ち出しファイルにテキストが無いと、処理部11Bは、持ち出しファイルに対してOCR処理を行う(ステップS11)。つまり、処理部11Bは、持ち出しファイルから文字を識別して文書に変換する処理を行う。この後、処理部11Bは、テキストを抽出したかどうかを判断する(ステップS12)。テキストを抽出すると、処理部11Bは、ステップS4以降の処理を行う。
On the other hand, if there is no text in the taken-out file in step S3, the
また、テキストを抽出しないと、処理部11Bは、ファイル数判別処理を行う(ステップS13)。ステップS13の持ち出しファイル数判別処理は図11に示す処理であり、処理部11Bは、ステップS1で指定された持ち出しファイルの数を調べ(ステップS81)、持ち出しファイルが複数かどうかを判断する(ステップS82)。持ち出しファイルが複数有ると、処理部11Bは、表示部11Dを制御して、持ち出し不可のエラーメッセージを表示し(ステップS83)、ファイル数判別処理を終了する。ステップS82で、持ち出しファイルが1つであると、処理部11Bは、ファイルを持ち出す実行ユーザ、実行日時、持ち出しファイルのファイル名をログ情報とする(ステップS84)。この後、処理部11Bは、通信部11Hを制御して、ログ情報を管理サーバ1に送信し(ステップS85)、USBインターフェース11Fに接続されているUSBメモリ20に持ち出しファイルを書き込み(ステップS86)、ファイル数判別処理を終了する。
If no text is extracted, the
このようにして、処理部11Bは、図7〜図11に示すデータ判定処理を行う。そして、データ判定処理が終わると、続いて処理部11Bは書き込み処理を終了する。
In this way, the
次に、この実施の形態のデータ管理システムを用いたデータ管理方法について説明する。管理サーバ1は、文書の中で機密情報を特徴付ける単語をデータ化して機密データ(図5)を作成し、このデータをデータベースサーバ2に記憶する。このとき、管理サーバ1は、パーソナルコンピュータ11、12で取り扱われる文書の中で、機密情報を含む文書を収集して、機密データ(図5)を作成する。また、管理担当者が管理用パーソナルコンピュータ3を操作して、機密データ(図5)を作成してもよい。さらに、データベースサーバ2が記憶している機密データ(図5)は、管理用パーソナルコンピュータ3からの修正が可能である。
Next, a data management method using the data management system of this embodiment will be described. The
こうした状態の場合に、例えば営業の担当者がパーソナルコンピュータ11を使用するとき、パーソナルコンピュータ11を起動し、社員データ(図4)に登録されているユーザIDとパスワードをパーソナルコンピュータ11に入力して、パーソナルコンピュータ11を使用状態にする。このとき、パーソナルコンピュータ11は、入力されたユーザIDとパスワードを記憶する。こうして、担当者は、パーソナルコンピュータ11を使用する。この後、USBメモリ20を使用するために、担当者がUSBメモリ20をパーソナルコンピュータ11に差し込む。さらに、パーソナルコンピュータ11に記憶されているファイルをUSBメモリ20に書き込もうとすると、書き込み専用のプログラムが実行されて、書き込み処理が行われ、続いて、データ判定処理が行われる。
In such a state, for example, when a sales representative uses the
この後、担当者により、ファイルが指定されて、書き込みの指示がパーソナルコンピュータ11に入力された場合に、持ち出しファイルにテキストがあるとき、パーソナルコンピュータ11は、持ち出しファイルの内容が機密情報であるかどうかに応じて、また、持ち出しファイルの重要度および持ち出し理由に応じて、USBメモリ20にファイルを書き込む際に、次のログ情報をデータベースサーバ2に送信する。
a.持ち出しファイルが機密情報でない場合、実行ユーザ、実行日時、ファイル名からなるログ情報を送信する。
b.持ち出しファイルが機密情報である場合、あらかじめ設定された各グループの重要度に比べて集計された重要度が低いとき、実行ユーザ、実行日時、ファイル名からなるログ情報を送信する。
c.持ち出しファイルが機密情報である場合、あらかじめ設定された各グループの重要度に比べて集計された重要度が高いとき、実行ユーザ、実行日時、ファイル名、ファイル本体、検出したキーワードからなるログ情報を送信する。
e.持ち出しファイルが機密情報である場合、持ち出し理由に特定理由が含まれているとき、実行ユーザ、実行日時、ファイル名、ファイル本体、持ち出し理由からなるログ情報を送信する。
f.持ち出しファイルが機密情報である場合、あらかじめ設定された各グループの重要度に比べて集計された重要度が高く、しかも、持ち出し理由に特定理由が含まれているとき、実行ユーザ、実行日時、ファイル名、ファイル本体、検出したキーワード、持ち出し理由からなるログ情報を送信する。
Thereafter, when a file is designated by the person in charge and a write instruction is input to the
a. If the taken-out file is not confidential information, log information including the execution user, execution date and time, and file name is transmitted.
b. When the taken-out file is confidential information, log information including an execution user, an execution date and time, and a file name is transmitted when the importance calculated is lower than the importance of each group set in advance.
c. When the taken-out file is confidential information, log information consisting of the execution user, execution date / time, file name, file body, and detected keyword is displayed when the importance is higher than the pre-set importance of each group. Send.
e. When the taken-out file is confidential information, when a specific reason is included in the taken-out reason, log information including the execution user, the execution date and time, the file name, the file body, and the reason for taking out is transmitted.
f. If the file to be taken out is confidential information, the importance calculated is higher than the importance of each group set in advance, and if the reason for taking out includes a specific reason, the execution user, execution date and time, file Send log information consisting of name, file body, detected keyword, and reason for taking out.
管理サーバ1は、こうしたログ情報を受信すると、このログ情報をデータベースサーバ2に記録して、持ち出しファイルの情報を管理する。もし、機密情報の流出が発生すると、管理担当者は、管理用パーソナルコンピュータ3を操作して、データベースサーバ2に記録したログ情報や社員データ(図4)を参照することにより、また、ファイル本体や持ち出し理由などにより、情報の流出元などを探すことが可能である。
When the
こうして、この実施の形態によれば、USBメモリ20等の小型記憶媒体にデータを書き込むときに、機密かどうかを判断するので、従来のようにデータの更新の影響を受けることがない。また、この実施の形態によれば、データを小型記憶媒体に書き込む際に、このデータが機密情報であるかどうかを判断するので、従来のように、ファイルの更新時に機密フラグの更新等を行うことを不要にすることができる。さらに、持ち出しファイルが機密情報である場合、重要度や持ち出し理由に応じて、ファイル本体をログ情報としてデータベースサーバ2に記録するかどうかを判断するので、データベースサーバ2に保存するログ情報のデータ量を小さくすることができ、データベースサーバ2の負担を軽くすることが可能である。しかも、グループに応じて、また、持ち出し理由に応じて、持ち出しファイルを管理することができる。例えば、漏洩した内容とファイル本体とを照合することにより、情報の流出元を特定することを可能にする。
Thus, according to this embodiment, when data is written to a small storage medium such as the USB memory 20, it is determined whether or not it is confidential, so that it is not affected by data update as in the prior art. Also, according to this embodiment, when data is written to a small storage medium, it is determined whether or not the data is confidential information, so that the confidential flag is updated when the file is updated as in the prior art. Can be made unnecessary. Further, when the taken-out file is confidential information, it is determined whether or not the file body is recorded in the
(実施の形態2)
この実施の形態では、実施の形態1のデータ判定処理に代わって、簡略化したものを用いる。なお、この実施の形態では、先の実施の形態と同一もしくは同一と見なされる構成要素には、それと同じ参照符号を付けて、その説明を省略する。この実施の形態では、図13のデータ判定処理を用いる。つまり、このデータ判定処理は、実施の形態1のデータ判定処理において、ステップS7のグループ化処理と、ステップS8の持ち出し理由指定処理を省略する。そして、これらの処理の代わりに、処理部11Bは、ステップS6の後、持ち出しファイルの中身であるファイル本体と、検出した機密情報を表すキーワードとをログ情報に付加して、ログ情報を変更し(ステップS7A)、次のステップS9の処理を行う。
(Embodiment 2)
In this embodiment, instead of the data determination process of the first embodiment, a simplified one is used. In this embodiment, components that are the same as or the same as those in the previous embodiment are given the same reference numerals, and descriptions thereof are omitted. In this embodiment, the data determination process of FIG. 13 is used. That is, this data determination process omits the grouping process in step S7 and the take-out reason designation process in step S8 in the data determination process of the first embodiment. Instead of these processes, the
この実施の形態によれば、小型記憶媒体に書き込むときに、機密かどうかを判断するので、従来のようにデータの更新の影響を受けることがない。また、この実施の形態によれば、ファイルを小型記憶媒体に書き込む際に、このファイルが機密情報であるかどうかを判断するので、従来のように、ファイルの更新時に機密フラグの更新等を行うことを不要にすることができる。さらに、この実施の形態によれば、ファイル本体をログ情報としてデータベースサーバ2に保存するので、漏洩した内容とファイル本体とを照合することにより、情報の流出元を特定することを可能にする。
According to this embodiment, when writing to a small storage medium, since it is determined whether or not it is confidential, there is no influence of data update as in the conventional case. Also, according to this embodiment, when writing a file to a small storage medium, it is determined whether or not the file is confidential information. Therefore, the confidential flag is updated at the time of updating the file as in the prior art. Can be made unnecessary. Furthermore, according to this embodiment, since the file body is stored in the
(実施の形態3)
この実施の形態では、実施の形態1のデータ判定処理を簡略化したものを用いる。なお、この実施の形態では、先の実施の形態と同一もしくは同一と見なされる構成要素には、それと同じ参照符号を付けて、その説明を省略する。この実施の形態では、実施の形態1のデータ判定処理において、ステップS7のグループ化処理と、ステップS8の持ち出し理由指定処理のどちらか一方を省略する。
(Embodiment 3)
In this embodiment, a simplified version of the data determination process of the first embodiment is used. In this embodiment, components that are the same as or the same as those in the previous embodiment are given the same reference numerals, and descriptions thereof are omitted. In this embodiment, in the data determination process of the first embodiment, either the grouping process in step S7 or the take-out reason specifying process in step S8 is omitted.
こうした実施の形態によれば、重要度に応じて、または、持ち出し理由により、ファイル本体をログ情報としてデータベースサーバ2に記録するかどうかを判断するので、データベースサーバ2に保存するログ情報のデータ量を小さくすることができる。
According to such an embodiment, since it is determined whether to record the file body as log information in the
以上、この発明の各実施の形態を詳述してきたが、具体的な構成は各実施の形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計の変更等があっても、この発明に含まれる。例えば、各実施の形態では、小型記憶媒体としてUSBメモリ20を例としたが、小型記憶媒体はこれに限定されることなく、例えば、USB接続が可能な大容量記憶装置などであってもよい。 As mentioned above, although each embodiment of this invention has been described in detail, the specific configuration is not limited to each embodiment, and even if there is a design change or the like without departing from the gist of this invention, It is included in this invention. For example, in each embodiment, the USB memory 20 is taken as an example of the small storage medium. However, the small storage medium is not limited to this, and may be, for example, a mass storage device capable of USB connection. .
1 管理サーバ
2 データベースサーバ(記憶手段)
11、12 パーソナルコンピュータ
20 USBメモリ(記憶媒体)
1
11, 12 Personal computer 20 USB memory (storage medium)
Claims (5)
前記管理サーバは、所定の解析方法によって、収集した各文書に共通して現れる単語を低く重み付けを行い、特定の文書に現れる単語を高く重み付けを行い、該解析方法によって重み付けをした単語をキーワードとすると共に重みの大きさに応じて重要度を表す値を該キーワードに付加し、該キーワードと、該キーワードを使用するグループとを関連付けて機密データとして前記データベースサーバに記憶し、
前記パーソナルコンピュータは、前記記憶媒体にデータを書き込むときに、該データから単語を抽出し、該単語と前記データベースサーバの機密データのキーワードとを対比して、該データが機密情報かどうかを判断し、該データが機密情報である場合に、該データに含まれるキーワードを使用するグループがあると、該キーワードをグループ別に分け、グループ毎に分けられた各キーワードの重要度を集計し、集計して得たグループ別の重要度と前記グループ別重要度データとを比較し、グループの重要度に比べて集計した重要度が大きい場合に、該グループの機密情報に該データが該当すると判断する、
ことを特徴とするデータ管理システム。 Necessary for managing confidential information, a personal computer that can use a storage medium that can write data, and that is used in each group of the organization, a management server that manages confidential information in the data handled by the personal computer, and As a data management system, a data base system that stores importance data for each group to which importance is added for each group is connected to the database server so that data communication is possible.
The management server weights words that appear in common in each collected document by a predetermined analysis method, weights words that appear in a specific document high, and uses the words weighted by the analysis method as keywords. And adding a value representing importance in accordance with the size of the weight to the keyword, associating the keyword with a group using the keyword and storing it as confidential data in the database server,
The personal computer, when writing data in the storage medium, extracts words from the data, and comparing the keyword of the sensitive data of the database server and said word, said data to determine whether confidential information When the data is confidential information, if there is a group that uses the keywords included in the data, the keywords are divided into groups, and the importance of each keyword divided for each group is tabulated and tabulated. Comparing the obtained importance by group and the importance data by group, and determining that the data corresponds to the confidential information of the group when the importance calculated is larger than the importance of the group;
A data management system characterized by that.
前記データベースサーバは、前記パーソナルコンピュータからログ情報を受け取ると、該ログ情報を記録しておくことを特徴とする請求項1に記載のデータ管理システム。 When the data to be written to the storage medium is confidential information, the personal computer sends log information of the data to the database server ,
The data management system according to claim 1, wherein when the database server receives log information from the personal computer, the database server records the log information.
前記管理サーバにより、所定の解析方法によって、収集した各文書に共通して現れる単語を低く重み付けを行い、特定の文書に現れる単語を高く重み付けを行い、該解析方法によって重み付けをした単語をキーワードとすると共に重みの大きさに応じて重要度を表す値を該キーワードに付加し、該キーワードと、該キーワードを使用するグループとを関連付けて機密データとして前記データベースサーバに記憶し、
前記パーソナルコンピュータにより、前記記憶媒体にデータを書き込むときに、該データから単語を抽出し、該単語と前記データベースサーバの機密データのキーワードとを対比して、該データが機密情報かどうかを判断し、該データが機密情報である場合に、該データに含まれるキーワードを使用するグループがあると、該キーワードをグループ別に分け、グループ毎に分けられた各キーワードの重要度を集計し、集計して得たグループ別の重要度と前記グループ別重要度データとを比較し、グループの重要度に比べて集計した重要度が大きい場合に、該グループの機密情報に該データが該当すると判断する、
ことを特徴とするデータ管理方法。 Necessary for managing confidential information, a personal computer that can use a storage medium that can write data, and that is used in each group of the organization, a management server that manages confidential information in the data handled by the personal computer, and A data management method for a system in which a database server that stores importance data for each group to which importance is added for each group is connected so as to be capable of data communication,
The management server assigns a low weight to words that appear in common in each collected document by a predetermined analysis method, weights a word that appears in a specific document high, and uses the words weighted by the analysis method as keywords. And adding a value representing importance in accordance with the size of the weight to the keyword, associating the keyword with a group using the keyword and storing it as confidential data in the database server,
When writing data to the storage medium by the personal computer, a word is extracted from the data, and the word is compared with a keyword of confidential data of the database server to determine whether the data is confidential information. When the data is confidential information, if there is a group that uses the keywords included in the data, the keywords are divided into groups, and the importance of each keyword divided for each group is tabulated and tabulated. Comparing the obtained importance by group and the importance data by group, and determining that the data corresponds to the confidential information of the group when the importance calculated is larger than the importance of the group;
A data management method characterized by the above.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2007260366A JP4772022B2 (en) | 2007-10-03 | 2007-10-03 | Data management system and data management method |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2007260366A JP4772022B2 (en) | 2007-10-03 | 2007-10-03 | Data management system and data management method |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2009093231A JP2009093231A (en) | 2009-04-30 |
| JP4772022B2 true JP4772022B2 (en) | 2011-09-14 |
Family
ID=40665205
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2007260366A Expired - Fee Related JP4772022B2 (en) | 2007-10-03 | 2007-10-03 | Data management system and data management method |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP4772022B2 (en) |
Family Cites Families (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| IL153184A0 (en) * | 2000-06-01 | 2003-06-24 | Safasoft Co Ltd | Total system for preventing information outflow from inside |
| JP4747591B2 (en) * | 2005-01-31 | 2011-08-17 | 日本電気株式会社 | Confidential document retrieval system, confidential document retrieval method, and confidential document retrieval program |
| US8051487B2 (en) * | 2005-05-09 | 2011-11-01 | Trend Micro Incorporated | Cascading security architecture |
-
2007
- 2007-10-03 JP JP2007260366A patent/JP4772022B2/en not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JP2009093231A (en) | 2009-04-30 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US8645866B2 (en) | Dynamic icon overlay system and method of producing dynamic icon overlays | |
| EP2478452B1 (en) | File search system and program | |
| US6178424B1 (en) | Information distributing system and storage medium recorded with a program for distributing information | |
| JP5283478B2 (en) | Search system | |
| US7937652B2 (en) | Document processing device, computer readable recording medium, and computer data signal | |
| US20100106709A1 (en) | File search system and file search server device | |
| US9183202B2 (en) | Notification methods for non-programmatic integration systems | |
| CN108363768A (en) | A kind of document search method, storage medium and server based on Lucene | |
| US20160112404A1 (en) | Systems and Methods for Synchronized Sign-on Methods for Non-programmatic Integration systems | |
| TW539960B (en) | Device management method, device management system, and recording medium for recording device management program | |
| JP3705439B1 (en) | Personal information search program, personal information management system, and information processing apparatus with personal information management function | |
| US11947915B1 (en) | System for determining document portions that correspond to queries | |
| US9081632B2 (en) | Collaboration methods for non-programmatic integration systems | |
| JP3918023B2 (en) | Personal information management system | |
| JP4772022B2 (en) | Data management system and data management method | |
| EP2325764B1 (en) | Archiving system | |
| JP2009110241A (en) | Electronic file management device | |
| KR20250132711A (en) | Method and system for providing authority control based retrieval augmented generation service | |
| JP2008186473A (en) | System and program for managing personal information | |
| JP4082520B2 (en) | Personal information search program | |
| CN101192211B (en) | Information processing apparatus and method | |
| CN117527296A (en) | Block chain-based data trusted access control method, device and equipment | |
| JP5887236B2 (en) | Business document processing apparatus, business document processing method, and business document processing program | |
| JP3928006B2 (en) | Customer information management system | |
| JP4887735B2 (en) | Information processing apparatus, information processing system, and program |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100319 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110421 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110426 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110526 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110614 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110621 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140701 Year of fee payment: 3 |
|
| R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 4772022 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140701 Year of fee payment: 3 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| LAPS | Cancellation because of no payment of annual fees |