JP3043643B2 - Sort processing apparatus and method - Google Patents
Sort processing apparatus and methodInfo
- Publication number
- JP3043643B2 JP3043643B2 JP9008463A JP846397A JP3043643B2 JP 3043643 B2 JP3043643 B2 JP 3043643B2 JP 9008463 A JP9008463 A JP 9008463A JP 846397 A JP846397 A JP 846397A JP 3043643 B2 JP3043643 B2 JP 3043643B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- kanji
- reading
- sorted
- file
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 26
- 238000006243 chemical reaction Methods 0.000 claims description 29
- 238000004458 analytical method Methods 0.000 claims description 25
- 238000007405 data analysis Methods 0.000 claims description 15
- 235000016496 Panda oleosa Nutrition 0.000 claims description 11
- 240000000220 Panda oleosa Species 0.000 claims description 11
- 238000003672 processing method Methods 0.000 claims description 3
- 241000406668 Loxodonta cyclotis Species 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 8
- 238000000605 extraction Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 3
- 244000205754 Colocasia esculenta Species 0.000 description 2
- 235000006481 Colocasia esculenta Nutrition 0.000 description 2
- 230000001174 ascending effect Effects 0.000 description 1
- FFBHFFJDDLITSX-UHFFFAOYSA-N benzyl N-[2-hydroxy-4-(3-oxomorpholin-4-yl)phenyl]carbamate Chemical compound OC1=C(NC(=O)OCC2=CC=CC=C2)C=CC(=C1)N1CCOCC1=O FFBHFFJDDLITSX-UHFFFAOYSA-N 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Description
【0001】[0001]
【発明の属する技術分野】本発明はソート処理装置およ
び方法に関し、特に漢字データを読みがなでソートする
ソート処理装置および方法に関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a sorting apparatus and method, and more particularly to a sorting apparatus and method for sorting Chinese character data by reading.
【0002】[0002]
【従来の技術】従来のソート処理装置および方法に相当
する技術の一例としては、例えば、特開昭60−100
223号公報がある。この発明では、従来、人手で行わ
れていた索引作成作業を、キーワード自動抽出技術およ
び漢字仮名変換技術を応用して自動化する装置を提供し
ている。このため、索引作成プログラムが起動される
と、原稿データ格納メモリから、ページ単位に原稿デー
タが入力され、ワークエリアAに格納される。原稿デー
タが入力されると、キーワード自動抽出装置がキーワー
ド自動抽出を行い抽出したキーワードをワークエリアB
に格納する。続いて各キーワード(索引語)について漢
字仮名変換装置により漢字仮名変換を行い、変換結果を
ワークエリアCに格納し、次にすべての索引語を、索引
語の読み仮名をソートキーとして、あいうえお順にソー
トする。読み仮名順の索引語はワークエリアDに格納
し、最後にすべての索引語について一覧表を印刷する様
になっている。2. Description of the Related Art An example of a technique corresponding to a conventional sorting apparatus and method is disclosed in, for example, JP-A-60-100.
No. 223 publication. According to the present invention, there is provided an apparatus for automating an index creation operation conventionally performed manually by applying a keyword automatic extraction technology and a kanji kana conversion technology. For this reason, when the index creation program is started, the document data is input in page units from the document data storage memory and stored in the work area A. When the manuscript data is input, the keyword automatic extraction device performs automatic keyword extraction and outputs the extracted keywords to the work area B.
To be stored. Subsequently, kanji-kana conversion is performed for each keyword (index word) by the kanji-kana conversion device, and the conversion result is stored in the work area C. Then, all index words are sorted in order from the top using the reading kana of the index word as a sort key. I do. Index words in the reading kana order are stored in the work area D, and a list is printed at the end for all index words.
【0003】[0003]
【発明が解決しようとする課題】上述した従来のソート
処理装置および方法は、キーワード自動抽出装置がキー
ワード自動抽出を行い抽出したキーワードをワークエリ
アBに格納する。続いて各キーワード(索引語)につい
て漢字仮名変換装置により漢字仮名変換を行い、変換結
果をワークエリアCに格納し、次にすべての索引語を、
索引語の読み仮名をソートキーとして、あいうえお順に
ソートする様になっているので、キーワード自動抽出装
置(本発明の漢字データ解析手段に相当する)や漢字仮
名変換装置(本発明のかな漢字逆変換辞書ファイルに相
当する)の機能がそれぞれ独立に設けられ、ワークエリ
アも各機能に対応して設けられ、全体として構成が大き
くなるという問題点がある。In the above-described conventional sorting apparatus and method, the automatic keyword extracting apparatus performs automatic keyword extraction and stores the extracted keywords in the work area B. Subsequently, kanji-kana conversion is performed for each keyword (index word) by the kanji-kana conversion device, and the conversion result is stored in the work area C.
Since the key words are sorted in the order of alphabetical order using the reading kana of the index word as a sort key, a keyword automatic extraction device (corresponding to the kanji data analysis means of the present invention) or a kanji kana conversion device (the kana-kanji reverse conversion dictionary file of the present invention) Is provided independently of each other, and a work area is also provided corresponding to each function, resulting in a problem that the configuration becomes large as a whole.
【0004】本発明の目的は、各機能を融合し、全体の
構成を小さくしたソート処理装置および方法を提供する
ことにある。An object of the present invention is to provide a sort processing apparatus and method in which functions are integrated and the overall configuration is reduced.
【0005】[0005]
【課題を解決するための手段】本発明の第1のソート処
理装置は、漢字データを読みがなでソートするソート処
理装置において、ソート対象の漢字データを格納する入
力ファイルと、漢字をかなに逆変換するデータを格納す
るかな漢字逆変換辞書ファイルと、ソート処理中のデー
タを一時記憶する記憶装置と、ソート処理完了後の漢字
データを出力する出力ファイルと、前記入力ファイルか
らソート対象の漢字データを受け前記かな漢字逆変換辞
書ファイルと前記記憶装置とを使用してソート処理を行
いソート処理完了後の漢字データを前記出力ファイルに
出力するデータ処理装置とを備え、 前記データ処理装置
が、ソート対象の漢字データを解析して熟語に分解する
漢字データ解析手段と、前記かな漢字逆変換辞書ファイ
ルを参照して前記漢字データ解析手段の解析した熟語の
読みがなを解析すると、前記読みがな解析手段の解析し
た読みがなを読みがなキーとして前記記憶装置に格納す
る読みがなキー格納手段と、すべてのソート対象の漢字
データを解析後前記記憶装置に格納した読みがなキーを
用いてソートし前記出力ファイルに出力するソート手段
とを有することを特徴とする。 According to a first aspect of the present invention, there is provided a sort processing apparatus for sorting kanji data by reading and reading an input file storing kanji data to be sorted. A kana-kanji reverse conversion dictionary file for storing data to be reverse-converted, a storage device for temporarily storing data being sorted, an output file for outputting kanji data after completion of the sort processing, and kanji data to be sorted from the input file and a data processing device for outputting to the output file the graphic data of the sort processing after completion performs sorting using said Kana-Kanji inverse conversion dictionary file and the storage device receives the said data processing device
Analyzes kanji data to be sorted and breaks it down into idioms
Kanji data analysis means and the Kana-Kanji reverse conversion dictionary file
Of the idiom analyzed by the kanji data analysis means with reference to the
When the reading is analyzed, the reading is analyzed by the reading analyzing means.
Store the reading as a reading key in the storage device.
Key reading means and all kanji to be sorted
After analyzing the data, read the reading key stored in the storage device.
Sorting means for sorting using and outputting to the output file
And characterized in that:
【0006】[0006]
【0007】本発明の第2のソート処理装置は、本発明
の第1のソート処理装置において、前記記憶装置が、ソ
ート対象の漢字データと、解析した結果としての読みが
なキーと、これらのデータの位置を示す順序とを一組の
データとして格納する読みがなキー格納テーブルを有す
ることを特徴とする。[0007] A second sort processing apparatus according to the present invention comprises:
In the first sort processing device, the storage device stores a kanji data to be sorted, a reading key as an analysis result, and an order indicating the position of these data as a set of data. to have a is a key storage table
It is characterized by that .
【0008】本発明の第1のソート処理方法は、漢字デ
ータを読みがなでソートするソート処理方法において、
入力ファイルに格納したソート対象の漢字データを漢字
データ解析手段が解析して熟語に分解し、読みがな解析
手段が漢字をかなに逆変換するデータを格納するかな漢
字逆変換辞書ファイルを参照して前記漢字データ解析手
段の解析した熟語の読みがなを解析し、読みがなキー格
納手段が前記読みがな解析手段の解析した読みがなを読
みがなキーとしてソート処理中のデータを一時記憶する
記憶装置に格納し、すべてのソート対象の漢字データを
解析後ソート手段が前記記憶装置に格納した読みがなキ
ーを用いてソートし結果を出力ファイルに出力すること
を特徴とする。[0008] A first sorting method of the present invention is a sorting method for sorting kanji data by reading.
The kanji data analysis unit analyzes the kanji data to be sorted stored in the input file and decomposes it into idioms, and the reading analysis unit stores data that converts kanji into kana inversely. The kanji data analysis unit analyzes the kanji analyzed by the kanji data analysis unit, and the kanji key storage unit temporarily stores the data being sorted using the kanji analyzed by the kanji analysis unit as the kanaga key. it is stored in a storage device for the graphic data of all the sorted analysis after sorting means for outputting to the output file sorted results using the key to read a stored in the storage device
It is characterized by .
【0009】本発明の第2のソート処理方法は、本発明
の第1のソート処理方法において、前記ソート処理中の
データを、ソート対象の漢字データと、解析した結果と
しての読みがなキーと、これらのデータの位置を示す順
序とからなる一組のデータとして記憶装置に設けた読み
がなキー格納テーブルに一時記憶することを特徴とす
る。A second sorting method according to the present invention provides
In the first sort processing method, a set of data consisting of kanji data to be sorted, a reading key as an analysis result, and an order indicating the position of the data is sorted in the first sort processing method. Temporarily stored in a reading key storage table provided in a storage device .
You .
【0010】[作用]漢字データ解析手段と読みがな解
析手段とにより、漢字データの読みがなを解析したの
ち、読みがなキー格納手段が読みがなキーを読みがなキ
ー格納テーブルに格納する。この読みがなをキーとして
ソート手段がソートを行うことにより、従来のソート処
理装置のように、各キーワード(索引語)について漢字
仮名変換装置により漢字仮名変換を行い、変換結果をワ
ークエリアCに格納する必要がなくなり、データファイ
ルの容量を削減することができる。[Action] After the reading of the kanji data is analyzed by the kanji data analyzing means and the reading analysis means, the reading key storage means stores the reading key in the reading key storage table. I do. Sorting is performed by the sorting means using the reading as a key, so that a kanji-kana conversion is performed for each keyword (index word) by a kanji-kana conversion device as in a conventional sort processing device, and the conversion result is stored in a work area C. There is no need to store the data, and the capacity of the data file can be reduced.
【0011】[0011]
【発明の実施の形態】次に、本発明の実施の形態につい
て図面を参照して説明する。Next, embodiments of the present invention will be described with reference to the drawings.
【0012】図1は本発明の第1の実施の形態を示すブ
ロック図である。FIG. 1 is a block diagram showing a first embodiment of the present invention.
【0013】本発明のソート処理装置6は、ソート対象
の漢字データを格納する入力ファイル3と、漢字をかな
に逆変換するデータを格納するかな漢字逆変換辞書ファ
イル5と、ソート処理中のデータを一時記憶する記憶装
置2と、ソート処理完了後の漢字データを出力する出力
ファイル4と、入力ファイル3からソート対象の漢字デ
ータを受け、かな漢字逆変換辞書ファイル5と記憶装置
2とを使用してソート処理を行い、ソート処理完了後の
漢字データを出力ファイル4に出力するデータ処理装置
1とを備えている。The sort processing device 6 of the present invention includes an input file 3 for storing kanji data to be sorted, a kana-kanji reverse conversion dictionary file 5 for storing data for reversely converting kanji, and a data being sorted. The storage device 2 for temporarily storing, the output file 4 for outputting the kanji data after the sorting process is completed, and the kanji data to be sorted received from the input file 3 and the kana-kanji reverse conversion dictionary file 5 and the storage device 2 are used. A data processing device 1 for performing a sort process and outputting the kanji data after the sort process is completed to an output file 4.
【0014】さらに、データ処理装置1は、ソート対象
の漢字データを解析して熟語に分解する漢字データ解析
手段11と、かな漢字逆変換辞書ファイル5を参照して
漢字データ解析手段11の解析した熟語の読みがなを解
析する読みがな解析手段12と、読みがな解析手段12
の解析した読みがなを読みがなキーとして記憶装置2に
格納する読みがなキー格納手段13と、すべてのソート
対象の漢字データを解析後記憶装置2に格納した読みが
なキーを用いてソートし、出力ファイル4に出力するソ
ート手段14とを含み、また、記憶装置2は、ソート対
象の漢字データと、解析した結果としての読みがなキー
と、これらのデータの位置を示す順序とを一組のデータ
として格納する読みがなキー格納テーブル21を含む。Further, the data processing device 1 analyzes the kanji data to be sorted and decomposes it into idioms, and the kanji data analyzed by the kanji data analysis means 11 with reference to the kana-kanji reverse conversion dictionary file 5. Reading analysis means 12 for analyzing the reading of the word, and reading analysis means 12
The reading key storage means 13 stores the analyzed reading as a reading key in the storage device 2 and the reading key stored in the storage device 2 after analyzing all the kanji data to be sorted. The storage device 2 sorts and outputs the output to the output file 4. The storage device 2 stores the kanji data to be sorted, the reading key as an analysis result, and the order indicating the positions of these data. Is stored as a set of data.
【0015】次に動作について説明する。Next, the operation will be described.
【0016】図2は本発明の第1の実施の形態の全体の
動作を説明する流れ図である。説明には図1の名称およ
び符号を用い、図2の流れに従って説明する。FIG. 2 is a flowchart for explaining the overall operation of the first embodiment of the present invention. The description will be made in accordance with the flow of FIG. 2 using the names and reference numerals of FIG.
【0017】入カファイル3から入力された1件目の漢
字データは、ステップ(以下Sと記す)1で漢字データ
解析手段11により解析され、熟語に分解される。分解
された熟語は、S2で読みがな解析手段12に供給さ
れ、読みがな解析手段12では分解された熟語を受ける
ごとにかな漢字逆変換辞書5に入力して読みがな解析を
行い、続いてS3で先に受領した熟語が複数の熟語から
成る場合にはすべての熟語に対応する読みがなの解析を
終了したか否かを判別し、まだ終了していなければS2
に戻り更に読みがな解析を行い、すべての熟語の読みが
な解析が終了していれば、S4でこれまでに解析された
読みがなを読みがなキー格納手段13が記憶装置2内に
定義してある読みがなキー格納テ−ブル21の1件目に
格納する。次にS5で入カファイル3の漢字データがな
くなったか否かを判別し、まだ漢字データが終了してい
なければS1に戻り漢字データがなくなるまで解析を繰
り返し、読みがなキー格納テーブル21に入カファイル
3に格納されている件数分の読みがなデータを格納す
る。全ての漢字データの解析が終了すれば、S6でソー
ト手段14が読みがなキー格納テーブル21の読みがな
キーをソートキーとして漢字データのソートを行い、結
果を出カファイル4に出力する。The first kanji data input from the input file 3 is analyzed by the kanji data analyzing means 11 in step (hereinafter referred to as S) 1 and decomposed into idioms. The decomposed idiom is supplied to the pronunciation analysis unit 12 in S2, and the reading analysis unit 12 inputs the decomposed idiom to the kana-kanji reverse conversion dictionary 5 every time it receives the decomposed idiom, and performs the pronunciation analysis. If the idiom previously received in S3 consists of a plurality of idioms, it is determined whether or not the analysis of the reading corresponding to all idioms has been completed.
When the pronunciation analysis is completed for all the idioms, the pronunciation analysis so far is performed in S4. It is stored in the first case of the defined reading key storage table 21. Next, in S5, it is determined whether or not the kanji data of the input file 3 has run out. If the kanji data has not been finished yet, the flow returns to S1 and the analysis is repeated until the kanji data runs out. Readable data for the number of cases stored in the file 3 is stored. When the analysis of all the kanji data is completed, the sorting means 14 sorts the kanji data using the reading key of the reading key storage table 21 as a sort key in S6, and outputs the result to the output file 4.
【0018】次に、本発明の一実施例の動作を説明す
る。Next, the operation of one embodiment of the present invention will be described.
【0019】本実施例は、本発明を氏名のソートに適用
した場合を示している。図3は入力ファイルに格納され
ているデータの一例を示す図であり、現在は「高橋 花
子」、「佐藤 太郎」、「鈴木 一郎」の3件の漢字デ
ータが登録されているものとする。図4は記憶装置内に
定義してある読みがなキー格納テ−ブルに格納されてい
るデータの一例を示す図であり、現在は「高橋 花
子」、「佐藤 太郎」、「鈴木 一郎」の3件の漢字デ
ータと読みがなキーとが格納されているものとする。図
5は出力ファイルに出力され格納されているデータの一
例を示す図であり、現在は「佐藤 太郎」、「鈴木 一
郎」、「高橋 花子」の3件の漢字データがソートされ
て格納されているものとする。This embodiment shows a case where the present invention is applied to sorting of names. FIG. 3 is a diagram showing an example of data stored in the input file. It is assumed that three kanji data of "Hanako Takahashi", "Taro Sato", and "Ichiro Suzuki" are currently registered. FIG. 4 is a diagram showing an example of data stored in a reading key storage table defined in the storage device. Currently, data of "Hanako Takahashi", "Taro Sato", and "Ichiro Suzuki" are displayed. It is assumed that three kanji data and a reading key are stored. FIG. 5 is a diagram showing an example of data output and stored in the output file. Currently, three kanji data of "Taro Sato", "Ichiro Suzuki", and "Hanako Takahashi" are sorted and stored. Shall be
【0020】まず、入カファイル3の1件目のデータ
「高橋 花子」を、漢字データ解析手段11に供給す
る。漢字データ解析手段11がこのデータ「高橋 花
子」を熟語に分解すると、「高橋」と「花子」の2つの
熟語になる。First, the first data “Hanako Takahashi” of the input file 3 is supplied to the kanji data analysis means 11. When the kanji data analysis means 11 decomposes this data “Hanako Takahashi” into idioms, it becomes two idioms “Takahashi” and “Hanako”.
【0021】漢字データ解析手段11は、この2つの熟
語を読みがな解析手段12に供給する。読みがな解析手
段12は、まず1つ目の熟語「高橋」をかな漢字逆変換
辞書5に入力し、読みがな「たかはし」を得る。続いて
読みがな解析手段12は、2つ目の熟語「花子」をかな
漢字逆変換辞書5に入力し、読みがな「はなこ」を得
る。ここまでで、1件目のデータ「高橋 花子」の読み
がな「たかはし はなこ」を得ることができる。この1
件目の読みがな「たかはし はなこ」を、読みがなキー
格納処理13が、記憶装置2に定義される読みがなキー
格納テーブル21の1件目に格納する。図2のS5のデ
ータの終了判断では、次のデータが存在するので解析処
理を終了せず、2件目のデータ「佐藤 太郎」を漢字デ
ータ解析手段11に供給し、2つの熟語「佐藤」と「太
郎」に分解する。続いて、この2つの熟語を読みがな解
析手段12に供給し、それぞれの読みがな「さとう」、
「たろう」を解析する。ここまでで得られた2件目の読
みがな「さとう たろう」は、読みがなキー格納処理1
3が、記憶装置2に定義される読みがな格納テーブル2
1の2件目に格納する。さらに、入カファイル3の3件
目のデータ「鈴木 一郎」に関しても、同様の手段によ
り読みがな「すずき いちろう」を得て、読みがな格納
テーブル21の3件目に格納する。3件目のデータ「鈴
木 一郎」の読みがな「すずき いちろう」を読みがな
キー格納テーブル21に格納したあと、図2のS5のデ
ータの終了判断で、解析処理を終了する。この結果、記
憶装置2に定義される読みがなキー格納テーブル21に
は、図4に示すように読みがなキーが格納されることに
なる。The kanji data analysis means 11 supplies the two idioms to the reading analysis means 12. The reading analyzer 12 first inputs the first idiom "Takahashi" to the Kana-Kanji reverse conversion dictionary 5, and obtains the reading "Takahashi". Subsequently, the reading analyzer 12 inputs the second idiom "Hanako" to the Kana-Kanji reverse conversion dictionary 5, and obtains the reading "Hanako". So far, you can get the reading of the first data "Hanako Takahashi""HanakoTakahashi". This one
The reading key storage process 13 stores the first reading “Hanako Takahashi” in the first reading of the reading key storage table 21 defined in the storage device 2. In the determination of the end of the data in S5 of FIG. 2, since the next data exists, the analysis processing is not ended, and the second data "Taro Sato" is supplied to the kanji data analysis means 11 to provide two idioms "Sato" And "Taro". Subsequently, these two idioms are supplied to the reading pronunciation analysis means 12, and the respective readings are read as "Sato",
Analyze "Taro". The second reading “Taro Sato” obtained up to this point is the key reading process 1
3 is a reading storage table 2 defined in the storage device 2
It is stored in the second case of 1. Further, with respect to the third data “Ichiro Suzuki” of the input file 3, “Yuzuro Suzuki” is obtained by the same means and stored in the third case of the reading storage table 21. After the third data "Ichiro Suzuki" is read and "Suzuki Ichiro" is stored in the read key storage table 21, the analysis process is terminated by the end determination of the data in S5 in FIG. As a result, the reading key storage table 21 defined in the storage device 2 stores the reading key as shown in FIG.
【0022】最後に、ソート手段14が、入カファイル
4のデータを読みがなキー格納テーブル21の読みがな
キーをソートキーとして昇順でソートし、出カファイル
4に出力する。この結果、出カファイル4には、図5に
示すように、図3に示した3件のデータを、読みがな順
にソートした結果が格納されることになる。Finally, the sorting means 14 sorts the data of the input file 4 in ascending order using the reading key of the reading key storage table 21 as a sort key, and outputs the data to the output file 4. As a result, as shown in FIG. 5, the output file 4 stores the result of sorting the three data items shown in FIG.
【0023】[0023]
【発明の効果】以上説明したように、本発明は、ソート
対象の漢字データを格納する入力ファイルと、漢字をか
なに逆変換するデータを格納するかな漢字逆変換辞書フ
ァイルと、ソート処理中のデータを一時記憶する記憶装
置と、ソート処理完了後の漢字データを出力する出力フ
ァイルと、前記入力ファイルからソート対象の漢字デー
タを受け前記かな漢字逆変換辞書ファイルと前記記憶装
置とを使用してソート処理を行いソート処理完了後の漢
字データを前記出力ファイルに出力するデータ処理装置
とを備えることにより、各機能を融合し、全体の構成を
小さくしたソート処理装置および方法を提供することが
可能と成るという効果が有る。As described above, the present invention provides an input file for storing kanji data to be sorted, a kana-kanji reverse conversion dictionary file for storing data for reversely converting kanji to kana, , A kanji data to be sorted from the input file, a kana-kanji reverse conversion dictionary file, and a sort process using the storage device. And a data processing device that outputs the kanji data after the completion of the sorting process to the output file. Thus, it is possible to provide a sorting device and a method that integrate the respective functions and reduce the overall configuration. There is an effect that.
【図1】本発明の第1の実施の形態を示すブロック図で
ある。FIG. 1 is a block diagram showing a first embodiment of the present invention.
【図2】本発明の第1の実施の形態の全体の動作を説明
する流れ図である。FIG. 2 is a flowchart illustrating the overall operation of the first embodiment of the present invention.
【図3】入力ファイルに格納されているデータの一例を
示す図である。FIG. 3 is a diagram illustrating an example of data stored in an input file.
【図4】記憶装置内に定義してある読みがなキー格納テ
−ブルに格納されているデータの一例を示す図である。FIG. 4 is a diagram showing an example of data stored in a reading key storage table defined in a storage device.
【図5】出力ファイルに出力され格納されているデータ
の一例を示す図である。FIG. 5 is a diagram illustrating an example of data output and stored in an output file.
1 データ処理装置 2 記憶装置 3 入力ファイル 4 出力ファイル 5 かな漢字逆変換辞書ファイル 6 ソート処理装置 11 漢字データ解析手段 12 読みがな解析手段 13 読みがなキー格納手段 14 ソート手段 21 キー格納テーブル REFERENCE SIGNS LIST 1 data processing device 2 storage device 3 input file 4 output file 5 kana-kanji reverse conversion dictionary file 6 sort processing device 11 kanji data analysis means 12 reading pronunciation analysis means 13 reading pronunciation key storage means 14 sorting means 21 key storage table
Claims (4)
ト処理装置において、ソート対象の漢字データを格納す
る入力ファイルと、漢字をかなに逆変換するデータを格
納するかな漢字逆変換辞書ファイルと、ソート処理中の
データを一時記憶する記憶装置と、ソート処理完了後の
漢字データを出力する出力ファイルと、前記入力ファイ
ルからソート対象の漢字データを受け前記かな漢字逆変
換辞書ファイルと前記記憶装置とを使用してソート処理
を行いソート処理完了後の漢字データを前記出力ファイ
ルに出力するデータ処理装置とを備え、 前記データ処理装置が、ソート対象の漢字データを解析
して熟語に分解する漢字データ解析手段と、前記かな漢
字逆変換辞書ファイルを参照して前記漢字データ解析手
段の解析した熟語の読みがなを解析すると、前記読みが
な解析手段の解析した読みがなを読みがなキーとして前
記記憶装置に格納する読みがなキー格納手段と、すべて
のソート対象の漢字データを解析後前記記憶装置に格納
した読みがなキーを用いてソートし前記出力ファイルに
出力するソート手段とを有す ることを特徴とするソート
処理装置。1. A sort processing device for sorting kanji data by reading a kanji, wherein an input file storing kanji data to be sorted, a kana kanji reverse conversion dictionary file storing data for reverse converting kanji into kana, and a sorter. A storage device for temporarily storing data being processed, an output file for outputting kanji data after the sorting process is completed, and a kana-kanji reverse conversion dictionary file for receiving kanji data to be sorted from the input file and the storage device A data processing device for performing the sorting process and outputting the kanji data after the sorting process to the output file , wherein the data processing device analyzes the kanji data to be sorted.
Kanji data analysis means for decomposing into idioms
The kanji data analysis method with reference to the character reverse conversion dictionary file.
Analyzing the pronunciation of the idioms analyzed in the column,
The readings analyzed by the various analysis means are used as the reading keys.
Read key storage means to be stored in the storage device and all
Analyzed Kanji data to be sorted and stored in the storage device
Sorted using the reading key that was output to the output file
Sorting device according to claim Rukoto which have a and sorting means for outputting.
タと、解析した結果としての読みがなキーと、これらの
データの位置を示す順序とを一組のデータとして格納す
る読みがなキー格納テーブルを有することを特徴とする
請求項1記載のソート処理装置。2. The method according to claim 1, wherein the storage device stores the kanji data to be sorted.
Data, the key of the reading as a result of analysis, and these
Stores the order indicating the data position as a set of data
2. The sort processing apparatus according to claim 1, further comprising a reading key storage table .
ト処理方法において、入力ファイルに格納したソート対
象の漢字データを漢字データ解析手段が解析して熟語に
分解し、読みがな解析手段が漢字をかなに逆変換するデ
ータを格納するかな漢字逆変換辞書ファイルを参照して
前記漢字データ解析手段の解析した熟語の読みがなを解
析し、読みがなキー格納手段が前記読みがな解析手段の
解析した読みがなを読みがなキーとしてソート処理中の
データを一時記憶する記憶装置に格納し、すべてのソー
ト対象の漢字データを解析後ソート手段が前記記憶装置
に格納した読みがなキーを用いてソートし結果を出力フ
ァイルに出力することを特徴とするソート処理方法。3. In a sorting method for sorting kanji data by reading kanji data, kanji data analyzing means analyzes kanji data stored in an input file and decomposes the kanji data into idioms. The kana-kanji reverse conversion dictionary file that stores data for converting kana to kana is analyzed by referring to the kana-kanji reverse conversion dictionary file, and the reading of the idiom analyzed by the kanji data analysis unit is analyzed. The analyzed reading is stored as a reading key in a storage device for temporarily storing the data being sorted, and after analyzing all the kanji data to be sorted, the reading means stores the reading key stored in the storage device. A sort processing method characterized in that the result is sorted by using the result and the result is output to an output file.
象の漢字データと、 解析した結果としての読みがなキー
と、これらのデータの位置を示す順序とからなる一組の
データとして記憶装置に設けた読みがなキー格納テーブ
ルに一時記憶することを特徴とする請求項3記載のソー
ト処理方法。 4. The method according to claim 1, wherein the data being sorted is sorted by
Elephant kanji data and key reading as analysis result
And an order to indicate the location of these data
Reading key storage table provided in storage device as data
4. The method according to claim 3, wherein the information is temporarily stored in a file .
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP9008463A JP3043643B2 (en) | 1997-01-21 | 1997-01-21 | Sort processing apparatus and method |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP9008463A JP3043643B2 (en) | 1997-01-21 | 1997-01-21 | Sort processing apparatus and method |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH10207876A JPH10207876A (en) | 1998-08-07 |
| JP3043643B2 true JP3043643B2 (en) | 2000-05-22 |
Family
ID=11693836
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP9008463A Expired - Fee Related JP3043643B2 (en) | 1997-01-21 | 1997-01-21 | Sort processing apparatus and method |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP3043643B2 (en) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2012068899A (en) * | 2010-09-24 | 2012-04-05 | Fujitsu Social Science Laboratory Ltd | Word/phrase rearrangement device, method and program |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP4195780B2 (en) * | 2001-04-16 | 2008-12-10 | インターナショナル・ビジネス・マシーンズ・コーポレーション | Program, data processing system and storage medium |
-
1997
- 1997-01-21 JP JP9008463A patent/JP3043643B2/en not_active Expired - Fee Related
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2012068899A (en) * | 2010-09-24 | 2012-04-05 | Fujitsu Social Science Laboratory Ltd | Word/phrase rearrangement device, method and program |
Also Published As
| Publication number | Publication date |
|---|---|
| JPH10207876A (en) | 1998-08-07 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP2726568B2 (en) | Character recognition method and device | |
| JP3043643B2 (en) | Sort processing apparatus and method | |
| JPH0782497B2 (en) | Document processor | |
| JPH0388062A (en) | Device for preparing document | |
| JP3470930B2 (en) | Natural language analysis method and device | |
| JPH05282360A (en) | Multilingual input device | |
| JP2520195B2 (en) | Japanese sentence proper term extraction device | |
| Satoh et al. | A collaborative supporting method between document processing and hypertext construction | |
| JPS6154569A (en) | Document image processing method | |
| JP2967995B2 (en) | Document processing apparatus and document processing method | |
| JP2550012B2 (en) | Pattern cutting and recognition method | |
| JPH0512257A (en) | Document creation device | |
| JPH04195580A (en) | Device for forming index term file | |
| JPH11175531A (en) | Similar case search apparatus and method | |
| JPH0113579B2 (en) | ||
| JPH02136970A (en) | English word search device | |
| JPH04270450A (en) | document creation device | |
| JPH05314191A (en) | Data base registration system | |
| JPS61122785A (en) | Sequential display system of sequential word | |
| JPH0498566A (en) | Character data conversion device | |
| JPH06309360A (en) | Full-text searching method matching process of negation condition | |
| JPH0512266A (en) | Document processor | |
| JPH06223055A (en) | Document input device | |
| JPH09128405A (en) | Document search method and document search device | |
| JPS61250772A (en) | Kana/kanji converter |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20000215 |
|
| LAPS | Cancellation because of no payment of annual fees |