Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JPH0612539B2 - Kanji / Kana conversion device - Google Patents
[go: Go Back, main page]

JPH0612539B2 - Kanji / Kana conversion device - Google Patents

Kanji / Kana conversion device

Info

Publication number
JPH0612539B2
JPH0612539B2 JP57174573A JP17457382A JPH0612539B2 JP H0612539 B2 JPH0612539 B2 JP H0612539B2 JP 57174573 A JP57174573 A JP 57174573A JP 17457382 A JP17457382 A JP 17457382A JP H0612539 B2 JPH0612539 B2 JP H0612539B2
Authority
JP
Japan
Prior art keywords
kana
kanji
rule
word
condition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP57174573A
Other languages
Japanese (ja)
Other versions
JPS5965342A (en
Inventor
和明 田中
誠 糸賀
順司 津田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Microcomputer System Ltd
Hitachi Ltd
Original Assignee
Hitachi Microcomputer System Ltd
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Microcomputer System Ltd, Hitachi Ltd filed Critical Hitachi Microcomputer System Ltd
Priority to JP57174573A priority Critical patent/JPH0612539B2/en
Publication of JPS5965342A publication Critical patent/JPS5965342A/en
Publication of JPH0612539B2 publication Critical patent/JPH0612539B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/53Processing of non-Latin text

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Input From Keyboards Or The Like (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】 〔発明の利用分野〕 本発明は、漢字仮名混りデータの漢字に読み仮名を自動
付与する漢字仮名変換方式に関するものである。
TECHNICAL FIELD The present invention relates to a kanji-kana conversion system for automatically giving a reading kana to kanji in kanji-kana mixed data.

〔従来技術〕[Prior art]

従来の漢字仮名変換方式においては、漢字の字単位の読
み仮名付けが基本であり、一字単位に漢字の読みが一意
に決められている。そしてそれ以外の読みとなる場合
は、その漢字前後の文字を合わせた熟語の例外辞書が用
意されており、変換処理において変換対象となる漢字が
例外辞書に登録されていれば、その読みを優先させる方
式をとつている。しかし、この方式では、幾つかの漢字
熟語が組み合わされた漢字文字列において、必ずしも各
熟語単位で読みが付与されるとは限らないため、本来意
図された熟語ではない漢字文字列の部分を熟語と判断し
て読みが付与される可能性があつた。例えば、「開発作
業」という熟語に読みを付与する場合、各漢字の読み
が、開(カイ)、発(ハツ)、作(サ)、業(ギヨウ)
と決められ、例外辞書には、発作(ホツサ)という熟語
が登録されていると、開発作業(カイホツサギヨウ)と
誤まつて読み仮名付けられる。
In the conventional kanji-kana conversion method, the kana reading of kanji is basically used for each character, and the kanji reading is uniquely determined for each character. If the reading is other than that, an exception dictionary is prepared for the compound words that combine the characters before and after the kanji, and if the kanji to be converted in the conversion process is registered in the exception dictionary, that reading is prioritized. The method of letting is adopted. However, in this method, in a kanji character string in which several kanji compound words are combined, the reading is not always given in each compound word unit, so the part of the kanji character string that is not the originally intended compound word is not There is a possibility that a reading will be added. For example, when adding a reading to the idiom “development work”, the reading of each kanji will be open (kai), utterance (hatsu), work (sa), and kaku (guiyo).
If the idiom of seizure (hotssa) is registered in the exception dictionary, it will be mistaken for development work (kaihotsagiyo) and will be given a pseudonym.

一方漢字仮名混り文を音声で出力する際には漢字の読み
仮名を付与することが必要となるが、このような用途に
利用する場合には音調に抑揚をつけるため、熟語単位で
み仮名付けを行うことが望ましい。しかしながら従来の
漢字仮名変換方式は字単位での変換を基本にしているた
め、上記のような用途には不向きであつた。
On the other hand, when outputting mixed sentences of kanji and kana by voice, it is necessary to add reading kana of kanji, but when using it for such purposes, in order to add tones to the tones, kana It is desirable to make a mark. However, the conventional kanji / kana conversion method is based on the conversion on a character-by-character basis, and thus is not suitable for the above-mentioned applications.

更に、漢字の読み仮名付与方法としては、漢字文字列の
先頭から漢字仮名辞書に登録されている漢字(一字の漢
字または、二字以上の漢字熟語)の中で、最長一致する
もの(語基と呼ぶ。)を逐次見つけ、その語基の読みを
付与する方式が考えられるが、次の要因により誤まつた
読みを付与する可能性がある。
In addition, as a method for assigning Kanji reading kana, the longest matching kanji (one kanji or two or more kanji compound words) registered in the kanji kana dictionary from the beginning of the kanji character string (word It is conceivable that the reading of the word base will be added and the reading of the word base will be added, but the wrong reading may be added due to the following factors.

(a) 接辞や、漢字仮名辞書に未登録な熟語の出現によ
り語基の認定を誤まることがある。
(a) Occurrence of an affix or a idiom that has not been registered in the Kanji / Kana dictionary may cause incorrect recognition of the word base.

(b) 同一熟語が、複数個の読みを持つことがある。(b) The same compound word may have multiple readings.

〔発明の目的〕[Object of the Invention]

本発明の目的は、漢字仮名混りデータに読み仮名を自動
付与する方式において、読み仮名を付与する対象となる
漢字文字列が、複数個の読みを有する場合、及び漢字文
字列が複数通りに分割でき、その分割された文字列が漢
字仮名辞書に登録されている場合に極めて高精度に読み
仮名付けを行い得る方式を提供することにある。
An object of the present invention is to automatically give a reading kana to mixed kanji kana data, in a case where the kanji character string to which the reading kana is attached has a plurality of readings, and when there are a plurality of kanji character strings. An object of the present invention is to provide a method that can be divided and that can perform reading kana naming with extremely high accuracy when the divided character string is registered in a kanji kana dictionary.

〔発明の概要〕[Outline of Invention]

本発明方式は読み仮名付与の単位となる語基の認定と、
読み仮名の選択とを次の手順で確認しつつ行なうことに
特徴がある。
According to the method of the present invention, recognition of a word base that is a unit of giving a kana,
The feature is that it is performed while confirming the selection of the reading kana in the following procedure.

(1) 最長一致により仮認定された漢字語基(前方語)
に対する複数個の読み仮名の中から、その語基の品詞や
前後の文字の属性などを手掛りに、読み仮名付与規則に
基づきその読み仮名を付与する。
(1) Kanji word base tentatively recognized by the longest match (forward word)
Based on the part-of-speech of the word base and the attributes of the preceding and following characters, the reading kana is given from the plurality of reading kana for the.

(2) (1)で仮認定された語基に続く漢字文字列に対し
て、同様に語基(後方語)を仮認定し、その読み仮名を
付与する。
(2) For the Kanji character string following the word base tentatively recognized in (1), similarly, the word base (backward word) is tentatively recognized and its phonetic kana is given.

(3) 前方語、後方語の字数や、品詞情報などを手掛り
に、変換処理制御規則に基づき、語基間の接続関係を調
べ、語基分割の妥当性をチエツクして読みを確定する。
(3) Based on the number of characters of the front word and the rear word, the part-of-speech information, etc., based on the conversion processing control rule, the connection relation between the word bases is checked, and the validity of the word base division is checked to determine the reading.

例えば、後方語が、1文字であると認定された場合、そ
れが接辞(この場合、接尾語)ならば、前方語は正しい
語基に分割されていると考えられるが、接辞でない場
合、前方語は本来意図された意味を持つ語基として認定
されていない可能性があり、再度、語基の認定をやり直
す。
For example, if a trailing word is identified as a single letter, if it is an affix (in this case, a suffix), then the leading word is considered to be split into the correct base, but if it is not, then the leading word is The word may not have been certified as a base having the originally intended meaning, and the base should be certified again.

〔発明の実施例〕Example of Invention

以下、本発明を図面を参照して詳細に説明する。本発明
の一実施例のハードウエア構成を第1図に示す。第1図
における1はプロセツサ、2は磁気テープや磁気デイス
ク等の漢字仮名混りデータ格納メモリ、3は漢字仮名変
換された漢字とその読み仮名データの格納メモリ、4は
プログラム格納メモリ、5はワーク・エリア、6は漢字
仮名辞書メモリ、7は変換処理制御規則テーブル・メモ
リ、8は読み仮名付与規則テーブル・メモリ、9はライ
ンプリンタを表わしている。漢字仮名辞書メモリ6に
は、第2図に示す様な形式の辞書が格納されている。つ
まり、1字以上の漢字文字列Aを見出し語として、その
読み仮名文字列B、語属性コードC、頻度情報Dとが格
納されている。ある漢字文字列に対して複数個の読みが
存在する場合や、ある漢字文字列とその読み仮名文字列
に対して複数個の語属性コードが存在する場合には、そ
れぞれに1組の構成をとるものとする。語属性コードC
は、漢字文字列Aとその読み仮名文字列Bとが有する文
法情報や、音読み訓読みといつた語属性を示す符号であ
り、その例を第3図に示す。頻度情報は、漢字文字列と
その読み仮名文字列および語属性コードが漢字仮名変換
時に用いられた頻度が格納されている。
Hereinafter, the present invention will be described in detail with reference to the drawings. A hardware configuration of one embodiment of the present invention is shown in FIG. In FIG. 1, 1 is a processor, 2 is a storage memory for kanji / kana mixed data such as magnetic tape or magnetic disk, 3 is storage memory for kanji / kana converted kanji and its kana reading data, 4 is program storage memory, 5 is A work area, 6 is a kanji kana dictionary memory, 7 is a conversion processing control rule table memory, 8 is a reading kana giving rule table memory, and 9 is a line printer. The kanji / kana dictionary memory 6 stores a dictionary having a format as shown in FIG. That is, the kana character string A of one or more characters is used as an entry word, and its phonetic kana character string B, word attribute code C, and frequency information D are stored. If there are multiple readings for a given kanji character string, or if there are multiple word attribute codes for a given kanji character string and its reading kana character string, configure one set for each. Shall be taken. Word attribute code C
Is a code indicating the grammatical information of the Kanji character string A and its phonetic kana character string B, and the pronunciation of the pronunciation and the word attribute, and an example thereof is shown in FIG. The frequency information stores the kanji character string, its reading kana character string, and the frequency with which the word attribute code was used during kanji kana conversion.

変換処理制御規則テーブル・メモリ7は、第4図に示す
様な論理的構成を有する。各変換処理制御規則は、条件
と、その条件が満足された場合に実行される処理との組
み合わせである。
The conversion processing control rule table memory 7 has a logical structure as shown in FIG. Each conversion process control rule is a combination of a condition and a process executed when the condition is satisfied.

各行が、各変換処理制御規則に対応し、右端を除く各列
が条件を示す。
Each row corresponds to each conversion processing control rule, and each column except the right end indicates the condition.

配列内のYes,No,−は、それぞれ各規則での各条
件が(Yes)「満足されなければならない」、(N
o)「満足されてはならない」、(−)「いずれでもよ
い」、ことを示す。右端の欄は、各規則の条件が満足さ
れたとき実施すべき処理の内容を示す。
Yes, No, and-in the array indicate that each condition in each rule is (Yes) "must be satisfied", (N
o) Indicates that "it must not be satisfied", and (-) "any is acceptable". The rightmost column shows the contents of processing to be executed when the conditions of each rule are satisfied.

各規則は、規則番号が小さいほど優先される。The smaller the rule number, the higher the priority of each rule.

変換処理制御規則番号1を例により説明する。The conversion processing control rule number 1 will be described as an example.

「前方語に読み仮名を付与できたか」という条件を満足
し、「前方語直後の文字は漢字か」という条件を満足し
なければ、「前方語の読み仮名を確定し、当該文字列に
対する読み仮名付け処理を終了する。」 上記規則テーブル(第4図)の物理的な実施例を第5図
に示す。ここで、配列内の各値は、“2”がYes、
“1”1がNo、“0”がPassを意味する。従つて第
5図の行a,b,cの各値は、第4図の規則番号1,
2,3の条件にそれぞれ対応する。第6図の各値は、第
5図の各列に対応して条件の判定を行なう条件サブルー
チン番号を示す。例えば条件番号1の「漢字文字列はあ
るか」という判定を行う処理プログラムにはサブルーチ
ン番号1100が付与されている。第7図の各値は、第
5図の各行に対応して各条件が満足されたとき実行され
る処理サブ・ルーチン番号を示す。例えば第7図の「1
0」は、第4図における規則番号1の条件が全部満足し
たときに行われる処理、つまり「前方後を確定する」と
いう処理を実行するプログラムのサブルーチン番号を示
す。読み仮名付与規則テーブル・メモリは、第8図に示
す様な論理的構成を有する。
If the condition "Is the phonetic kana given to the forward word given?" Is satisfied and the condition "Is the character immediately after the forward word a kanji?" Is not satisfied, "Define the phonetic kana of the forward word and read it for the character string. The pseudonymization process is completed. "A physical example of the rule table (Fig. 4) is shown in Fig. 5. Here, "2" is Yes for each value in the array,
“1” 1 means No and “0” means Pass. Therefore, the values in rows a, b, and c in FIG.
It corresponds to a few conditions, respectively. Each value in FIG. 6 indicates a condition subroutine number for determining the condition corresponding to each column in FIG. For example, a subroutine number 1100 is added to the processing program for determining whether there is a Chinese character string of condition number 1. Each value in FIG. 7 indicates a processing sub-routine number executed when each condition is satisfied corresponding to each row in FIG. For example, "1" in FIG.
"0" indicates the subroutine number of the program that executes the process performed when all the conditions of rule number 1 in FIG. 4 are satisfied, that is, the process of "determining the front-back". The reading kana name giving rule table memory has a logical structure as shown in FIG.

第8図の見方や物理的実施方法は、変換処理制御規則テ
ーブルと同様である。
The view and the physical implementation method of FIG. 8 are the same as those of the conversion processing control rule table.

プログラムは、第9図のようなモジユール構成をとる。
漢字仮名変換メインモジユール20では、各規則テーブ
ル(第4図、第81図)をプロセッサ1へロードする処
理、漢字仮名変換の対象となる漢字データを漢字データ
格納メモリ2から取出す処理、漢字データを、非漢字と
漢字との間で区切り、漢字仮名変換処理単位(ここで
は、文節と呼ぶ)を設定する処理、処理単位毎に変換処
理制御モジユールを参照する処理、漢字仮名変換された
漢字とその読み仮名データを、仮名データ格納メモリ3
へ出力する処理および、処理実行中のエラーに対するエ
ラーメツセージをラインプリンタへ出力する処理を行な
う。
The program has a module structure as shown in FIG.
In the Kanji / Kana conversion main module 20, a process of loading each rule table (FIGS. 4 and 81) into the processor 1, a process of extracting Kanji data to be subjected to Kanji / Kana conversion from the Kanji data storage memory 2, a Kanji data Is separated between non-Kanji and Kanji, and the process of setting the Kanji Kana conversion processing unit (called a phrase here), the process of referring to the conversion process control module for each processing unit, and the Kanji Kana converted Kanji The reading kana data is stored in the kana data storage memory 3
To output to the line printer and an error message for an error during execution of the process.

変換処理制御モジユール21は、変換処理制御規則テー
ブル(第4図)に従い、第6図で示したサブルーチン番
号に対応する条件サブルーチン22を参照し、リターン
・コードが、規則表の値とすべて一致したものであつて
且つ規則番号の一番小さな規則に相当するサブルーチン
番号(第7図参照)の実行処理サブルーチン23を起動
する。本実施例では、漢字仮名変換の対象となる漢字文
字列が、漢字仮名辞書に登録されている複数の漢字文字
列(語基とよぶ)から構成されている場合、語基の認定
誤りを防止するため、連続する2つの語基(前方語およ
び後方語とよぶ)の接続関係を調べて妥当性を確認しつ
つその語基の読み仮名を付与する方式としている。それ
ゆえ、前方語に対してその読み仮名を付与ることや、後
方語に対してその読み仮名を付与することも、変換処理
制御規則の一条件としている。それぞれ、前方語に対す
る読み仮名付与条件サブルーチン22a、後方語に対す
る読み仮名付与条件サブルーチン22bと呼ぶ。
The conversion processing control module 21 refers to the conditional subroutine 22 corresponding to the subroutine number shown in FIG. 6 according to the conversion processing control rule table (FIG. 4), and the return code matches all the values in the rule table. The execution processing subroutine 23 of the subroutine number (see FIG. 7) corresponding to the rule having the smallest rule number is started. In the present embodiment, when the kanji character string to be converted into kanji kana is composed of a plurality of kanji character strings (called word bases) registered in the kanji kana dictionary, a mistaken recognition of the word base is prevented. For this reason, the method of assigning a phonetic alphabet for the word base while checking the validity by checking the connection relationship between two consecutive word bases (referred to as a forward word and a backward word). Therefore, the addition of the phonetic kana to the forward word and the addition of the phonetic kana to the backward word are also conditions for the conversion processing control rule. They are called a phonetic kana addition condition subroutine 22a for the forward word and a phonetic kana addition condition subroutine 22b for the backward word, respectively.

各サブルーチン22a,22bは、変換処理制御モジユ
ール21と同様に、読み仮名付与規則テーブルに基づ
き、条件サブルーチン24と、実行処理サブルーチン2
5とを起動して、複数個存在する読み仮名の中から、最
適なものを選択する。
Similar to the conversion processing control module 21, each of the subroutines 22a and 22b is based on the reading kana provision rule table, and the condition subroutine 24 and the execution processing subroutine 2
5 and are started, and the optimum one is selected from a plurality of reading kana.

次に、変換処理手順について、「新規則の追加」という
漢字仮名混りデータに読み仮名を付与する場合を例にと
つて説明する。
Next, the conversion processing procedure will be described by taking as an example the case of giving a reading kana to the kanji kana mixed data of "adding a new rule".

初めに、漢字仮名変換メインモジュール20の処理内容
について、第20図のフローチヤートに基づき説明す
る。
First, the processing contents of the kanji / kana conversion main module 20 will be described based on the flow chart of FIG.

漢字仮名変換メインモジュールは、起動されると、変換
処理制御規則テーブル(第4図)を変換処理制御規則テ
ーブルメモリ7から、プロセツサ1上にロードし、ワー
クエリアCRULEに格納する(101)とともに、読み仮
名付与規則テーブル(第8図)を読み仮名付与規則テー
ブル・メモリ8から、プロセツサ1上にロードし、ワー
クエリアYRULEに格納する(102)。次に漢字仮名混
りデータ格納メモリ2から、漢字仮名変換の対象となる
データ「新規則の追加」を読み込む(103)。もし対
象となるデータが漢字仮名混りデータ格納メモリ2にな
いと漢字仮名変換メインルーチンの処理を終了する。読
み込まれた漢字仮名混りデータは、非漢字から漢字への
変化点で分割され、ワークエリアKANJIに格納される
(104)。上記の例では、ワークエリアKANJI(1)に
「新規則の」が格納され、ワークエリアKANJI(2)に「追
加」が格納される。
When the Kanji / Kana conversion main module is started, the conversion processing control rule table (FIG. 4) is loaded from the conversion processing control rule table memory 7 onto the processor 1 and stored in the work area CRULE (101). The reading kana provision rule table (FIG. 8) is loaded from the reading kana provision rule table memory 8 onto the processor 1 and stored in the work area YRULE (102). Next, the data "addition of new rule" which is the target of kanji / kana conversion is read from the kanji / kana mixed data storage memory 2 (103). If the target data is not in the kanji / kana mixed data storage memory 2, the process of the kanji / kana conversion main routine is terminated. The read kanji / kana mixed data is divided at the change points from non-kanji to kanji and stored in the work area KANJI (104). In the above example, "new rule" is stored in the work area KANJI (1), and "additional" is stored in the work area KANJI (2).

漢字仮名混りデータが分割されたものを、ここでは文節
と呼ぶが、その文節の個数を、パラメータNUMに格納
する(105)。上記の例では2が格納される。Kに1
個目の分節を示す1を格納(106)し、第K番目の分
節KANJI(K)をバツフアAに格納する(107)。上記の
例では、第14図のように漢字仮名変換対象文字列が格
納される。エラーコードERCODEに0を格納(108)
後、変換処理制御モジユール21を起動し、読み仮名処
理を行ない、結果をバツフアBに格納する(109)。
上記の例では、第15図のように漢字とその読みが格納
される。処理終了後、エラーコードが0でなければ、
(110)、エラーメツセージをラインプリンタに出力
して(111)、漢字仮名変換処理メインモジュールの
処理を終了する。
The data obtained by dividing the kanji / kana mixed data is called a phrase here, and the number of the phrase is stored in the parameter NUM (105). In the above example, 2 is stored. 1 for K
The value 1 indicating the segment is stored (106), and the Kth segment KANJI (K) is stored in buffer A (107). In the above example, a kanji-kana conversion target character string is stored as shown in FIG. Store 0 in error code ERCODE (108)
After that, the conversion processing control module 21 is activated to perform the reading kana processing, and the result is stored in the buffer B (109).
In the above example, kanji and their readings are stored as shown in FIG. After processing, if the error code is not 0,
(110), the error message is output to the line printer (111), and the process of the Kanji-kana conversion main module is completed.

エラーコードが0ならば(110)、バツフアBの内容
を仮名データ格納メモリ3に出力する(112)。Kに
1を加えた後次の文節(113)があるかを判定し(1
14)、存在すれば107以降の処理を繰返し、存在し
なければ、103以降の処理を繰返す。上記例では、第
2番目の文節「追加」について、107以降の処理が行
なわれ、その読み仮名が仮名データ格納メモリに出力さ
れ、その後103で、漢字仮名変換の対象となる漢字仮
名データがないため、漢字仮名変換メインモジュールの
処理を終了する。
If the error code is 0 (110), the contents of buffer B are output to the kana data storage memory 3 (112). After adding 1 to K, it is judged whether there is a next clause (113) (1
14) If it exists, the processing from 107 onward is repeated, and if it does not exist, the processing from 103 onward is repeated. In the above example, with respect to the second phrase “addition”, the processing after 107 is performed, the reading kana is output to the kana data storage memory, and then 103, there is no kanji kana data to be converted to kanji kana. Therefore, the processing of the kanji-kana conversion main module is ended.

変換処理制御方法について、第11図のフローチヤート
に基づき説明する。
A conversion processing control method will be described based on the flow chart of FIG.

変換処理制御モジユール21は、起動されると、再処理
カウンタAGAINに0を格納し(201)、Iに第1番目
の変換処理制御規則を示す1を格納し(202)、Jに
第1番目の変換処理制御条件を示す1を格納し(20
3)、リターンコードに0を格納し(204)、第J番
目の変換処理制御条件サブルーチンを起動する(20
5)。205を処理中にエラーが発生したかどうかを判
定し(206)、エラーがあれば変換処理制御モジユー
ル21の処理を終了する。エラーがなければ、変換処理
制御規則CRULE(I,J)の値が0か、又は、変換処理制御規
則CRULE(I,J)と205の処理結果のリターンコードRCOD
Eとが等しいかを判定し(207)、満足すれば208
を、満足しなければ210を実行する。208でJに1
を加えた(208)後、第J番目の変換処理制御条件が
あるかを判定して(209)、満足すれば、204以降
の処理を繰返し、満足しなければ、第I番目の変換処理
制御実行処理サブルーチンを起動する(213)。21
3の処理中にエラーが発生したかどうかを判定して(2
14)、エラーがあれば変換処理制御モジユール21の
処理を終了し、エラーがなければ、213の処理で、再
処理カウンタAGAINに0以外の値が格納されたかを判定
し(215)、0以外の値が格納されていれば、202
以降の処理を繰返す。
When the conversion processing control module 21 is activated, it stores 0 in the reprocessing counter AGAIN (201), stores 1 in I indicating the first conversion processing control rule (202), and stores the first in J. The conversion processing control condition of 1 is stored (20
3), 0 is stored in the return code (204), and the Jth conversion processing control condition subroutine is activated (20
5). It is determined whether an error has occurred during the processing of 205 (206), and if there is an error, the processing of the conversion processing control module 21 is ended. If there is no error, the value of the conversion processing control rule CRULE (I, J) is 0, or the return code RCOD of the processing result of the conversion processing control rules CRULE (I, J) and 205.
It is judged whether E and E are equal (207), and if satisfied, 208
If not satisfied, 210 is executed. 1 for J at 208
After adding (208), it is judged whether or not there is a Jth conversion processing control condition (209), and if satisfied, the processing after 204 is repeated. The execution processing subroutine is started (213). 21
Determine whether an error occurred during the processing of 3 (2
14) If there is an error, the processing of the conversion processing control module 21 is terminated, and if there is no error, it is judged in the processing of 213 whether a value other than 0 is stored in the reprocessing counter AGAIN (215). If the value of
The subsequent processing is repeated.

再処理カウンタAGAINのフラグが0ならば、バツフアA
に格納されている漢字のすべてに読みが付与されている
かを判定して(216)、読みがすべての漢字に付与さ
れていれば変換処理制御モジユール21の処理を終了
し、読みがついていない漢字があれば、201以降の処
理を繰返す。
If the flag of reprocessing counter AGAIN is 0, buffer A
It is judged whether all the kanji stored in the kanji have been given readings (216). If the readings have been given to all kanji, the conversion process control module 21 ends the processing, and the kanji without readings are added. If there is, the processing after 201 is repeated.

210で、Iに1を加えた後、第I番目の変換処理制御
規則があるかを判定して(211)、満足すれば、20
3以降の処理を繰返し、満足しなければエラーコードER
CODEに1を格納して(212)変換処理制御モジユール
21の処理を終了する。
At 210, after adding 1 to I, it is judged whether there is an I-th conversion processing control rule (211), and if satisfied, 20
Repeat the processing after 3 and if not satisfied, error code ER
1 is stored in CODE (212) and the process of the conversion process control module 21 is ended.

本実施例では、変換処理制御規則の条件サブルーチン2
2として、バツフアAの先頭文字が漢字かを判定するサ
ブルーチン(第4図の条件番号1)と、前方語に読みを
付与するサブルーチン(条件番号2)と、前方語直後の
文字が漢字かを判定するサブルーチン(条件番号3)
と、再処理中かを判定するサブルーチン(条件番号4)
と前方語が2文字以上かを判定するサブルーチン(条件
番号5)と前方語が接頭語かを判定するサブルーチン
(条件番号6)と、後方語に読みを付与するサブルーチ
ン(条件番号7)と、後方語が2文字以上かを判定する
サブルーチン(条件番号8)と、後方語が接頭語又は接
尾語かどうかを判定するサブルーチン(条件番号9)
と、後方語の直後の文字が漢字かを判定するサブルーチ
ン(条件番号10)があり、処理実行後、条件を満足し
ていれば、リターンコードRCODEに2を格納し、条件を
満足していなければ、リターンコードRCODEに1を格納
する。
In the present embodiment, the conditional subroutine 2 of the conversion processing control rule
2, a subroutine (condition number 1 in FIG. 4) for determining whether the first character of the buffer A is a kanji character, a subroutine (condition number 2) for giving a reading to the forward word, and a character immediately after the forward word are kanji characters. Subroutine to judge (condition number 3)
And a subroutine for determining whether reprocessing is in progress (condition number 4)
And a subroutine (condition number 5) for determining whether the forward word has two or more characters, a subroutine (condition number 6) for determining whether the forward word is a prefix, and a subroutine for adding reading to the backward word (condition number 7). Subroutine for determining if the backward word is two or more characters (condition number 8) and subroutine for determining whether the backward word is a prefix or suffix (condition number 9)
Then, there is a subroutine (condition number 10) that determines whether the character immediately after the backward word is Kanji. If the condition is satisfied after executing the process, store 2 in the return code RCODE and satisfy the condition. For example, 1 is stored in the return code RCODE.

又、変換処理制御規則の実行処理サブルーチン23とし
て、バツフアE内の前方語とその読み仮名をバツフアB
に格納するサブルーチン(第4図の規則番号1の処理参
照)と、バツフアE内の前方語とその読み仮名およびバ
ツフアF内の後方語とその読み仮名をバツフアBに格納
するサブルーチン(規則番号2,7,11参照)と、バ
ツフアE内の前方語とその読み仮名をバツフアBに格納
し、バツフアA内の読み仮名未付与文字列をバツフアA
の先頭に移すサブルーチン(規則番号3,6,8,1
2)と、バツフアEの前方語とその読み仮名およびバツ
フアFの後方語とその読み仮名をバツフアBに格納し、
バツフアA内の読み仮名未付与文字列をバツフアAの先
頭に移すサブルーチン(規則番号4,9)と、再処理カ
ウンタAGAINに1を加え、バツフアEの前方語とその読
み仮名およびバツフアFの後方語とその読み仮名を第2
0図に例示するような、バツフアGに格納するサブルー
チン(規則番号5,10)と、バツフアGの漢字文字列
とその読み仮名をバツフアBに格納し、バツフアA内の
読み仮名未付与文字列をバツフアAの先頭に移すサブル
ーチン(規則番号13,14)と、バツフアA内の非漢
字文字列があれば、バツフアBに格納するサブルーチン
(規則番号15)がある。
Further, as the execution processing subroutine 23 of the conversion processing control rule, the forward word in the buffer E and its reading kana are buffer B.
In the buffer E (see the processing of rule number 1 in FIG. 4), and a subroutine for storing the forward word and its reading kana in buffer E and the backward word in buffer F and its reading kana in buffer B (rule number 2). , 7 and 11), the forward word in the buffer E and its phonetic kana are stored in the buffer B, and the character string without the phonetic kana in the buffer A is stored in the buffer A.
Subroutine to move to the beginning of (rule number 3, 6, 8, 1
2), the forward word of the buffer E and its phonetic kana and the backward word of the buffer F and its phonetic kana are stored in the buffer B,
Subroutine (rule number 4, 9) for moving the character string without reading kana in buffer A to the beginning of buffer A and adding 1 to the reprocessing counter AGAIN, and the forward word of buffer E and its reading kana and the back of buffer F Second word and its phonetic kana
As shown in FIG. 0, a subroutine (rule numbers 5 and 10) for storing in buffer G, a kanji character string of buffer G and its phonetic kana are stored in buffer B, and a character string not yet given in phonetic A in buffer A To the beginning of buffer A (rule numbers 13 and 14), and if there is a non-Kanji character string in buffer A, there is a subroutine to store it in buffer B (rule number 15).

尚、処理中に、不合理な事象が発生したら、エラーコー
ドERCODEに0以外の数値を格納して処理を終了する。
If an irrational event occurs during processing, a value other than 0 is stored in the error code ERCODE and the processing ends.

上記例の「新規則」では、漢字仮名辞書6に、「新規
則」という熟語が登録されておらず、「新規」、「規
則」、「新」、「規」、「則」が登録されているとする
と、第1回目には、第4図に示す変換処理制御規則番号
5が適用され、「新規」と「則」とで読み仮名を付与し
て、仮にバツフアGに格納され、再処理カウンタAGAIN
に1が格納される。再処理カウンタが0でないことから
(215)、再度、変換処理制御規則に基づき変換処理
が行なわれ、変換処理規則番号11が適用され、「新」
と「規則」とで読み仮名が付与され、バツフアBに格納
される(第15図参照)。その後、変換処理制御モジユ
ール21の処理が終了する。
In the “new rule” of the above example, the idiom “new rule” is not registered in the kanji kana dictionary 6, but “new”, “rule”, “new”, “rule”, and “rule” are registered. Then, in the first time, the conversion processing control rule number 5 shown in FIG. 4 is applied, the reading kana is given by “new” and “rule”, and it is temporarily stored in the buffer G, Processing counter AGAIN
1 is stored in. Since the reprocessing counter is not 0 (215), the conversion process is performed again based on the conversion process control rule, the conversion process rule number 11 is applied, and "new" is applied.
And a "rule" are added to the reading kana and stored in the buffer B (see FIG. 15). After that, the process of the conversion process control module 21 ends.

上記例「追加」については、漢字仮名辞書に、「追加」
という熟語が登録されているとすると、第1回目に、変
換処理制御規則番号1が適用され「追加」に読み仮名
「ツイカ」が付与されて、バツフアBに格納後、変換処
理制御モジユール21の処理が終了する。
For the above example "Add", add "Add" to the Kanji Kana dictionary.
In the first time, the conversion processing control rule number 1 is applied, the phonetic kana “Tsuika” is added to “Add”, the result is stored in the buffer B, and then the conversion processing control module 21 is added. The process ends.

次に、前方語や後方語に対する読み仮名付与方法につい
て、第12図および第13図のフローチヤートに基づき
説明する。
Next, a method of giving reading kana to the forward word and the backward word will be described with reference to the flowcharts of FIGS. 12 and 13.

前方語に対する読み仮名付与サブルーチンは、第12図
に示すように、起動されると、再照合カウンタFAGAINに
0を格納し(1101)、再処理カウンタAGAINが0か
を判定し(1102)して、0ならば1104以降の処
理を実行し、0でなければ、再処理カウンタFAGAINに再
照合カウンタAGAINの値を代入(1103)後、110
4以降の処理を実行する。1104では、FIに、第1
番目の読み仮名付与規則(第8図参照)を示す1を格納
する(1104)とともに、FJに、第1番目の読み仮
名付与条件を示す1を格納(1105)後、リターンコ
ードYRCODEに0を格納(1106)して、第FJ番目の
読み仮名付与条件サブルーチンを起動する(110
7)。
As shown in FIG. 12, the reading kana assigning subroutine for the forward word, when activated, stores 0 in the rematch counter FAGAIN (1101) and determines whether the reprocessing counter AGAIN is 0 (1102). , 0, the processes after 1104 are executed, and if it is not 0, the value of the re-matching counter AGAIN is assigned to the re-processing counter FAGAIN (1103), and then 110
The processing after 4 is executed. At 1104, the FI first
After storing 1 indicating the 1st reading kana provision rule (see FIG. 8) (1104) and storing 1 indicating the 1st reading kana provision condition in FJ (1105), 0 is set to the return code YRCODE. It is stored (1106) and the FJ-th reading kana provision condition subroutine is activated (110).
7).

1107を処理中にエラーが生じたかを判定して(11
08)、エラーがあれば前方語に対する読み仮名付与サ
ブルーチンの処理を終了し、エラーがなければ、読み仮
名付与規則YRULE(FI,FJ)の値が0か、又はYRULE(FI,FJ)
と、1107の処理結果のリターンコードYRCODEとの値
が等しいかを判定して(1109)、満足すれば111
0以降の処理を実行し、満足しなければ1112以降の
処理を実行する。
It is determined whether an error has occurred during processing 1107 (11
08), if there is an error, the processing of the reading kana addition subroutine for the forward word is terminated, and if there is no error, the value of the reading kana addition rule YRULE (FI, FJ) is 0 or YRULE (FI, FJ)
And the return code YRCODE of the processing result of 1107 are equal (1109), and if satisfied, 111
The processing after 0 is executed, and if not satisfied, the processing after 1112 is executed.

1110では、FJに1を加えた(1110)後、第F
J番目の読み仮名付与規則条件があるかを判定して(1
111)、満足すれば、1106以降の処理を繰返し、
満足しなければ、第FI番目の読み仮名付与実行処理サ
ブルーチンを起動する(1115)。1115では、付
与した読み仮名データが、第17図に例示するような、
バツフアDに格納される。
At 1110, after adding 1 to FJ (1110), the Fth
Judge whether there is a Jth reading kana provision rule condition (1
111), if satisfied, repeat the processing after 1106,
If not satisfied, the FIth reading kana addition execution processing subroutine is started (1115). In 1115, the added reading kana data is as shown in FIG.
It is stored in the buffer D.

1115の処理中にエラーが発生したかどうかを判定し
て(1116)、エラーがあれば、前方語に対する読み
仮名付与サブルーチンの処理を終了し、エラーがなけれ
ば、バツフアDのデータを、第18図に例示するよう
な、バツフアEに移した(1117)後、1115の処
理で、再照合カウンタFAGAINに0以外の値が格納されて
いないかを判定して(1118)、0以外の値が格納さ
れていれば、1102以降の処理を繰返し、0が格納さ
れていれば、前方語に対する読み仮名付与処理を終了す
る。
It is determined whether or not an error has occurred during the processing of 1115 (1116), and if there is an error, the processing of the reading kana assigning subroutine for the preceding word is ended. If there is no error, the data of buffer D is After moving to the buffer E (1117) as illustrated in the figure, in the processing of 1115, it is determined whether or not a value other than 0 is stored in the re-verification counter FAGAIN (1118). If it is stored, the processing from 1102 onward is repeated, and if 0 is stored, the reading kana addition processing for the forward word is ended.

1112で、FIに1を加えた(1112)後、第FI
番目の読み仮名付与規則があるかを判定して(111
3)、存在すれば、1105以降の処理を繰返し、存在
しなければ、エラーコードERCODEに、2を格納して前方
語に対する読み仮名付与サブルーチンの処理を終了す
る。
At 1112, after adding 1 to the FI (1112), the FI
It is judged whether there is the second reading kana assignment rule (111
3) If it exists, the processing after 1105 is repeated. If it does not exist, 2 is stored in the error code ERCODE and the processing of the reading kana addition subroutine for the preceding word is completed.

後方語に対する読み仮名付与サブルーチンは、第13図
に示すように起動されると、再照合カウンタBAGAINに0
を格納し(1201)、パラメータBIに、第1番目の
読み仮名付与規則を示す1を格納し(1202)、パラ
メータBJに、第1番目の読み仮名付与条件を示す1を
格納(1203)後、リターンコードYRCODEに0を格納
(1204)して、第BJ番目の読み仮名付与条件サブ
ルーチンを起動する(1205)。1205を処理中
に、エラーが発生したかを判定して(1206)、エラ
ーがあれば後方語に対する読み仮名付与サブルーチンの
処理を終了し、エラーがなければ、読み仮名付与規則YR
ULE(BI,BJ)の値が0か、又は、YRULE(BI,BJ)と、120
5の処理結果のリターンコードYRCODEとの値が等しいか
を判定して(1207)、満足すれば1208以降の処
理を実行し、満足しなければ、1211以降の処理を実
行する。
When the reading kana addition subroutine for the backward word is activated as shown in FIG. 13, the rematch counter BAGAIN is set to 0.
Is stored (1201), the parameter BI is set to 1 indicating the first reading kana provision rule (1202), and the parameter BJ is set to 1 indicating the first reading kana provision condition (1203). , 0 is stored in the return code YRCODE (1204), and the BJ-th reading kana provision condition subroutine is activated (1205). During processing of 1205, it is judged whether an error has occurred (1206), and if there is an error, the processing of the reading kana addition subroutine for the backward word is ended. If there is no error, the reading kana addition rule YR
The value of ULE (BI, BJ) is 0, or YRULE (BI, BJ) is 120
It is determined whether the value of the return code YRCODE of the processing result of 5 is equal (1207), and if satisfied, the processing of 1208 and subsequent steps is executed, and if not satisfied, the processing of 1211 and subsequent steps is executed.

1208では、BJに1を加えた(1208)後、第B
J番目の読み仮名付与条件があるかを判定して(120
9)、満足すれば、1204以降の処理を繰り返し、満
足しなければ、第BI番目の読み仮名付与実行処理サブ
ルーチンを起動する(1210)。1210では、付与
した読み仮名データが、バツフアDに格納される。
In 1208, after adding 1 to BJ (1208),
It is determined whether or not there is a J-th reading kana provision condition (120
9) If it is satisfied, the processing from 1204 onward is repeated, and if it is not satisfied, the BI-th reading kana addition execution processing subroutine is started (1210). At 1210, the added reading kana data is stored in the buffer D.

1210の処理中にエラーが発生したかどうかを判定し
て(1214)、エラーがあれば、後方語に対する読み
仮名付与サブルーチンの処理を終了し、エラーがなけれ
ば、バツフアDのデータを、第19図に例示するよう
な、バツフアFに移した(1215)後、1210の処
理で、再照合カウンタBAGAINに0以外の値が格納されて
いないかを判定して(1216)、0以外の値が格納さ
れていれば、1202以降の処理を繰返し、0が格納さ
れていれば、後方語に対する読み仮名付与処理を終了す
る。
It is determined whether or not an error has occurred during the processing of 1210 (1214), and if there is an error, the processing of the reading kana assigning subroutine for the backward word is ended. If there is no error, the data of buffer D is set to the 19th. As shown in the figure, after moving to the buffer F (1215), it is judged in the process of 1210 whether a value other than 0 is stored in the rematch counter BAGAIN (1216). If it is stored, the processing from 1202 onward is repeated, and if 0 is stored, the phonetic provision processing for the backward word is ended.

1211で、BIに1を加えた(1211)後、第BI
番目の読み仮名付与規則があるかを判定して(121
2)、存在すれば、1203以降の処理を繰返し、存在
しなければ、エラーコードERCODEに、3を格納して後方
語に対する読み仮名付与サブルーチンの処理を終了す
る。
At 1211, after adding 1 to BI (1211), the BI
It is determined whether there is the second rule for assigning reading kana (121
2) If it exists, the processing after 1203 is repeated, and if it does not exist, 3 is stored in the error code ERCODE and the processing of the reading kana giving subroutine for the backward word is ended.

本実施例では、読み仮名付与規則の条件サブルーチンと
して、漢字仮名辞書に登録されている漢字文字列の中
で、バツフアAの漢字仮名変換文字列の先頭から、最長
一致するものあるいは、もし、再照合フラグが0以外の
値ならば、最長一致文字数から再照合フラグの値を引い
た文字数のものを取出し、第16図に示すバツフアCに
格納後、それが2文字以上の文字列かを判定するサブル
ーチン(第8図条件番号1参照)と、バツフアCの漢字
文字列が1文字かを判定するサブルーチン(条件番号
2)と、バツフアCの漢字文字列の中で、五段動詞と認
定できるものがあるかを判定するサブルーチン(条件番
号3)と、バツフアCの漢字文字列の中で、接頭語と認
定できるものがあるかを判定するサブルーチン(条件番
号4)と、バツフアCの漢字文字列の中で、接尾語と認
定できるものがあるかを判定するサブルーチン(条件番
号5)と、バツフアCの漢字文字列の中で、形容詞と認
定できるものがあるかを判定するサブルーチン(条件番
号6)と、バツフアCの漢字文字列の中で、五段動詞、
接頭語、接尾語、形容詞、音読み、訓読み以外のものが
あるかを判定するサブルーチン(条件番号7)と、バツ
フアCの漢字文字列が、音読みと訓読みの両方の読みが
あるかを判定するサブルーチン(条件番号8)と、バツ
フアA内の最長一致した文字列の直後の文字が漢字かを
判定するサブルーチン(条件番号9)があり、処理実行
後、条件を満足していれば、リターンコードYRCODEに2
が格納され、条件を満足していなければ、YRCODEに1が
格納される。
In this embodiment, as a conditional subroutine of the rule for assigning phonetic kana, among the kanji character strings registered in the kanji kana dictionary, the one that has the longest match from the beginning of the kanji kana converted character string of buffer A or if If the collation flag is a value other than 0, the number of characters obtained by subtracting the value of the re-collation flag from the number of longest matching characters is taken out, stored in buffer C shown in FIG. 16, and it is determined whether or not it is a character string. The subroutine (see FIG. 8, condition number 1) and the subroutine (condition number 2) that determines whether the Kanji character string of buffer C is one character, and the Kanji character string of buffer C can be identified as a five-stage verb. There is a subroutine (condition number 3) that determines whether there is something, and a subroutine (condition number 4) that determines whether or not there is one that can be recognized as a prefix in the Kanji character string of buffer C. Subroutine (condition number 5) that determines whether or not there is a kanji character string that can be recognized as a suffix, and subroutine that determines whether or not any of the kanji character strings of buffer C can be recognized as an adjective ( Condition number 6) and the Kanji character string of Bathua C
Subroutine (condition number 7) that determines whether there is anything other than a prefix, suffix, adjective, on-reading, and kun-yomi, and a subroutine that determines whether the Kanji character string of buffer C has both on-yomi and kun-yomi There is a subroutine (condition number 9) that determines whether the character immediately after the longest matching character string in buffer A is Kanji (condition number 9), and if the condition is satisfied after the processing is executed, the return code YRCODE To 2
Is stored, and if the condition is not satisfied, 1 is stored in YRCODE.

又、読み仮名付与規則の実行処理サブルーチンとして、
バツフアCの漢字文字列の中で、語属性が五段動詞であ
るものを、バツフアDに格納するサブルーチン(第8図
の規則番号1,7に対応する処理)と、バツフアCの漢
字文字列の中で、語属性が接頭語であるものを、バツフ
アDに格納するサブルーチン(規則番号2,8)と、語
属性が接尾語であるものを、バツフアDに格納するサブ
ルーチン(規則番号3,9)と、バツフアCの漢字文字
列の中で、語属性が形容詞であるものを、バツフアDに
格納するサブルーチン(規則番号4,10)と、バツフ
アCの漢字文字列の中で、語属性が五段動詞、接頭語、
接尾語、形容詞、音読み、訓読み以外であるものを、バ
ツフアDに格納するサブルーチン(規則番号5,11)
と、再照合フラグに1を加算するサブルーチン(規則番
号6)と、バツフアCの漢字文字列の中で、語属性が音
読みであるものを、バツフアDに格納するサブルーチン
(規則番号12)と、バツフアCの漢字文字列の中で、
語属性が訓読みであるものを、バツフアDに格納するサ
ブルーチン(規則番号13)と、語属性が音読み又は訓
読みであるものを、バツフアDに格納するサブルーチン
(規則番号14)とがある。尚、各実行処理サブルーチ
ンの処理中、バツフアDに格納すべきものが複数個存在
する場合は、バツフアCの各漢字文字列の頻度の最大の
ものを選ぶものとし、頻度が同じならば、バツフアCの
上段に位置するものを選ぶものとする。
Also, as an execution processing subroutine of the reading kana provision rule,
A subroutine (a process corresponding to the rule numbers 1 and 7 in FIG. 8) for storing a character whose word attribute is a five-stage verb in the buffer C's Kanji character string and the buffer C's Kanji character string Among these, a subroutine (rule number 2, 8) for storing the one having the word attribute as the prefix in the buffer D and a subroutine (rule number 3, for storing the one for which the word attribute is the suffix as the suffix) 9) and a subroutine (rule numbers 4 and 10) for storing in the buffer D the character whose word attribute is an adjective in the Chinese character string of buffer C and the word attribute in the Chinese character string of buffer C. Is a five-verb, prefix,
Subroutine for storing in the buffer D anything other than suffixes, adjectives, on-reading and kun-reading (rule numbers 5 and 11)
And a subroutine (rule number 6) for adding 1 to the re-matching flag, and a subroutine (rule number 12) for storing in the buffer D a Kanji character string of the buffer C whose word attribute is on reading. In the character string of Bathua C,
There is a sub-routine (rule number 13) for storing the word attribute of kun-yomi in buffer D, and a subroutine (rule number 14) for storing the word attribute of on-reading or kun-reading in buffer D. During the processing of each execution processing subroutine, if there is more than one to be stored in the buffer D, the one having the highest frequency of each Kanji character string in the buffer C is selected, and if the frequency is the same, the buffer C is selected. The one located in the upper row shall be selected.

又、各条件サブルーチンおよび各実行処理サブルーチン
を処理中に、不合理な事象が発生したら、エラーコード
ERCODEに0以外の数値を格納して処理を終了する。
Also, if an unreasonable event occurs during processing of each condition subroutine and each execution subroutine, an error code
Store a value other than 0 in ERCODE and end the process.

〔発明の効果〕〔The invention's effect〕

本発明によれば、次のような効果が得られる。 According to the present invention, the following effects can be obtained.

(1) 漢字仮名混り文の漢字文字列に、語基単位で読み
仮名を付与することができる。
(1) You can add reading kana in word base units to the kanji character strings of mixed kanji kana sentences.

(2) 複数個の読み仮名を持つ漢字文字列に対する読み
仮名選定基準を、条件と実行処理とを1組とした規則と
して登録する方式としたことにより、規則の変更や追加
・削除は、規則テーブルの修正、条件サブルーチンの追
加・削除、実行サブルーチンの追加・削除という形態を
とり、変換処理プロシジヤの変更が不要なため、規則の
改良および拡張が容易に行なえる。
(2) By using the method of registering the phonetic kana selection criteria for a kanji character string having a plurality of kana characters as a rule with a set of conditions and execution processes, rules can be changed or added / deleted. It takes the form of table correction, addition / deletion of conditional subroutines, addition / deletion of execution subroutines, and since it is not necessary to change the conversion processing procedure, the rules can be easily improved and expanded.

(3) 変換処理手順についても、変換処理制御規則とし
て規則化することにより、規則の改良および拡張が容易
に行なえる。
(3) The conversion processing procedure can also be easily improved and expanded by formulating it as a conversion processing control rule.

(4) 変換処理を制御する規則と、読み仮名を付与する
規則とを分離したことにより、漢字仮名変換規則の数を
少なくすることができる。
(4) By separating the rule for controlling the conversion process and the rule for giving the reading kana, the number of kanji and kana conversion rules can be reduced.

実施例は、変換処理制御規則が15個、読み仮名付与規
則が14個、合計29個の規則で構成されているが、分
離されていないと、前方語と後方語に読み仮名を付与す
ることから約100倍の14×14×15=2940個
もの規則を必要とする。
In the embodiment, the conversion processing control rules are 15 and the reading rules are 14 in total, 29 rules in total, but if they are not separated, the reading words are given to the forward and backward words. From about 100 times as many as 14 × 14 × 15 = 2940 rules are required.

【図面の簡単な説明】[Brief description of drawings]

第1図は、本発明の一実施例の漢字仮名変換方式のハー
ドウエア構成図、第2図は、漢字仮名辞書の項目を示す
図、第3図は、漢字仮名辞書の一項目である語属性の例
を示す図、第4図は、漢字仮名変換処理の制御規則の論
理的な構成例を示す図、第5図は、漢字仮名変換制御規
則のメモリ内での格納のされ方を示す図、第6図は、漢
字仮名変換制御規則の各条件に対応するサブルーチン番
号のメモリ内での格納のされ方を示す図、第7図は、漢
字仮名変換制御規則の各実行処理に対応するサブルーチ
ンの番号のメモリ内での格納のされ方を示す図、第8図
は、読み仮名付与規則の論理的な構成例を示す図、第9
図は、本発明実施例のソフトウエア・モジユール構成を
例示する図、第10図(A),(B)は、漢字仮名変換メイン
・モジユールの処理手順を示す図、第11図(A),(B)
は、変換処理制御規則に基づく、変換処理制御モジユー
ルの処理手順を示す図、第12図(A),(B)は、読み仮名
付与規則に基づく、前方語の読み仮名付与処理手順を示
す図、第13図(A),(B)は、読み仮名付与規則に基づ
く、後方語の読み仮名付与処理手順を示す図、第14図
は、バツフアAの構成を例示した図、第15図は、バツ
フアBの構成を例示した図、第16図は、バツフアCの
構成を例示した図、第17図は、バツフアDの構成を例
示した図、第18図は、バツフアEの構成を例示した
図、第19図は、バツフアFの構成を例示した図、第2
0図は、バツフアGの構成を例示した図である。
FIG. 1 is a hardware configuration diagram of a kanji / kana conversion system according to an embodiment of the present invention, FIG. 2 is a diagram showing items of a kanji / kana dictionary, and FIG. 3 is a word which is one item of a kanji / kana dictionary. FIG. 4 is a diagram showing an example of attributes, FIG. 4 is a diagram showing an example of a logical configuration of a control rule for Kanji-Kana conversion processing, and FIG. 5 is a diagram showing how the Kanji-Kana conversion control rule is stored in the memory. 6 and 6 show how the subroutine numbers corresponding to the respective conditions of the Kanji-Kana conversion control rule are stored in the memory, and FIG. 7 corresponds to each execution process of the Kanji-Kana conversion control rule. FIG. 8 is a diagram showing how the numbers of the subroutines are stored in the memory, FIG. 8 is a diagram showing a logical configuration example of the reading kana naming rule, and FIG.
FIG. 10 is a diagram illustrating a software module configuration of an embodiment of the present invention, FIGS. 10 (A) and (B) are diagrams showing a processing procedure of a kanji / kana conversion main module, FIG. 11 (A), (B)
Is a diagram showing a processing procedure of the conversion processing control module based on the conversion processing control rule, and FIGS. 12 (A) and 12 (B) are diagrams showing a processing procedure of giving the pronunciation of a forward word based on the reading kana character assignment rule. , FIG. 13 (A) and FIG. 13 (B) are diagrams showing a processing procedure for assigning the pronunciation of a backward word based on the rules for assigning the pronunciation kana, FIG. 14 is a diagram illustrating the configuration of the buffer A, and FIG. FIG. 16 illustrates the configuration of buffer C, FIG. 17 illustrates the configuration of buffer C, FIG. 17 illustrates the configuration of buffer D, and FIG. 18 illustrates the configuration of buffer E. FIG. 19 and FIG. 19 are views exemplifying the structure of the buffer F, and FIG.
FIG. 0 is a diagram illustrating the configuration of the buffer G.

フロントページの続き (72)発明者 津田 順司 神奈川県川崎市麻生区王禅寺1099番地 株 式会社日立製作所システム開発研究所内 (56)参考文献 特開 昭56−92677(JP,A)Front page continued (72) Inventor Junji Tsuda 1099 Ozenji, Aso-ku, Kawasaki-shi, Kanagawa Inside the Hitachi, Ltd. System Development Laboratory (56) References JP-A-56-92677 (JP, A)

Claims (4)

【特許請求の範囲】[Claims] 【請求項1】漢字文字列からなる単語と該単語の少なく
とも1つ以上の読み仮名文字列及び語属性とを対応させ
て格納した辞書と、漢字文字列からなる単語の語属性の
認定可否に関する条件と、該条件の成立状態に応じて前
記漢字文字列からなる単語の読み仮名を選択する処理と
からなる第1規則を記憶する第1の記憶手段と、入力さ
れた漢字文字列を少なくとも2つの単語に仮分割し、前
記辞書及び第1規則に基づいて仮分割された単語に読み
仮名文字列を付与する手段と、仮分割された漢字文字列
内の連続する2つの単語の語属性及び読み仮名付与の可
否に関する条件と、該条件の成立状態に対応して実施す
べき読み仮名文字列を確定する処理及び前記仮分割をや
り直す処理とからなる第2規則を記憶する第2の記憶手
段と、前記連続する2つの単語に関して前記第2規則に
定められる条件の成立状態を判定し、前記第2規則を参
照して前記連続する2つの単語の分割の妥当性をチェッ
クする手段と、該チェック手段により分割が妥当である
と判断されたとき、前記第2規則に基づいて前記読み仮
名文字列を確定する手段とを有することを特徴とする漢
字仮名変換装置。
1. A dictionary in which a word consisting of a kanji character string and at least one or more reading kana character strings and word attributes of the word are stored in association with each other, and the word attribute of the word consisting of a kanji character string can be recognized. First storage means for storing a first rule consisting of a condition and a process of selecting a reading kana of a word consisting of the kanji character string in accordance with the condition of the satisfaction of the condition, and at least two input kanji character strings. Means for temporarily dividing into two words and giving a reading kana character string to the words temporarily divided based on the dictionary and the first rule; word attributes of two consecutive words in the temporarily divided kanji character string; Second storage means for storing a second rule consisting of a condition relating to whether or not to give a reading kana, a process of determining a reading kana character string to be executed corresponding to the condition of the satisfaction of the condition, and a process of redoing the temporary division. And the above Means for determining the satisfaction of the condition defined by the second rule for two words, checking the validity of the division of the two consecutive words with reference to the second rule, and dividing by the checking means. And a means for determining the reading kana character string based on the second rule when it is determined to be valid.
【請求項2】特許請求の範囲第1項記載の漢字仮名変換
装置において、前記仮名文字列を付与する手段は、前記
チェック手段により前記仮分割が不適切であると判断さ
れたとき、前記第2規則に定められた処理に基づいて、
前記仮分割をやりなおすことを特徴とする漢字仮名変換
装置。
2. The kanji / kana conversion device according to claim 1, wherein the means for assigning the kana character string includes the means for assigning the kana when the checking means determines that the tentative division is inappropriate. Based on the processing prescribed in 2 rules,
A kanji / kana conversion device, wherein the temporary division is performed again.
【請求項3】特許請求の範囲第1項記載の漢字仮名変換
装置において、前記第1規則は単語の語属性の認定可否
に関する複数の条件と、該複数の条件の成立状態に対応
付けられた複数の処理とからなり、前記第1の記憶手段
は、該第1の規則をテーブル形式で記憶することを特徴
とする漢字仮名変換装置。
3. The kanji-kana conversion device according to claim 1, wherein the first rule is associated with a plurality of conditions relating to approval or disapproval of word attributes of words, and a condition in which the plurality of conditions are satisfied. An apparatus for converting kana to kana, comprising a plurality of processes, wherein the first storage means stores the first rule in a table format.
【請求項4】特許請求の範囲第1項記載の漢字仮名変換
装置において、前記第2規則は、連続する2つの単語の
語属性及び読み仮名付与の可否に関する複数の条件と、
該複数の条件の成立状態に対応付けられた複数の処理と
からなり、前記第2の記憶手段は、該第2規則をテーブ
ル形式で記憶することを特徴とする漢字仮名変換装置。
4. The kanji / kana conversion device according to claim 1, wherein the second rule includes a plurality of conditions regarding word attributes of two consecutive words and whether or not to give a reading kana.
A kanji / kana conversion device, comprising a plurality of processes associated with the established condition of the plurality of conditions, wherein the second storage means stores the second rule in a table format.
JP57174573A 1982-10-06 1982-10-06 Kanji / Kana conversion device Expired - Lifetime JPH0612539B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57174573A JPH0612539B2 (en) 1982-10-06 1982-10-06 Kanji / Kana conversion device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57174573A JPH0612539B2 (en) 1982-10-06 1982-10-06 Kanji / Kana conversion device

Publications (2)

Publication Number Publication Date
JPS5965342A JPS5965342A (en) 1984-04-13
JPH0612539B2 true JPH0612539B2 (en) 1994-02-16

Family

ID=15980917

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57174573A Expired - Lifetime JPH0612539B2 (en) 1982-10-06 1982-10-06 Kanji / Kana conversion device

Country Status (1)

Country Link
JP (1) JPH0612539B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0731675B2 (en) * 1986-01-28 1995-04-10 カシオ計算機株式会社 Kana-Kanji mutual conversion device
JPH0731674B2 (en) * 1986-01-28 1995-04-10 カシオ計算機株式会社 Kana-Kanji mutual conversion device

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5692677A (en) * 1979-12-26 1981-07-27 Fujitsu Ltd Kanji (chinese character)/kana (japanese syllabary) converter

Also Published As

Publication number Publication date
JPS5965342A (en) 1984-04-13

Similar Documents

Publication Publication Date Title
JP4024861B2 (en) Natural language parser with dictionary-based part-of-speech probabilities
US4641264A (en) Method for automatic translation between natural languages
US5610812A (en) Contextual tagger utilizing deterministic finite state transducer
US4994966A (en) System and method for natural language parsing by initiating processing prior to entry of complete sentences
US5890103A (en) Method and apparatus for improved tokenization of natural language text
US7243305B2 (en) Spelling and grammar checking system
US6349282B1 (en) Compound words in speech recognition systems
JPH0418346B2 (en)
JPH02299068A (en) Word separation method and apparatus
JPH0724055B2 (en) Word division processing method
WO1997004405A9 (en) Method and apparatus for automated search and retrieval processing
US5396419A (en) Pre-edit support method and apparatus
Bick A constraint grammar based spellchecker for danish with a special focus on dyslexics
JPH0612539B2 (en) Kanji / Kana conversion device
WO2003003241A1 (en) Predictive cascading algorithm for multi-parser architecture
JP2595934B2 (en) Kana-Kanji conversion processor
CN1208901A (en) The Method of Automatic Analysis and Processing of Chinese Polyphonic Characters
JP3136973B2 (en) Language analysis system and method
JPH0619960A (en) Morphological analysis processing method
JP3343941B2 (en) Example sentence search system
JPH0587857B2 (en)
EP0314503A2 (en) Dictionary structure for document processing apparatus
JP2827066B2 (en) Post-processing method for character recognition of documents with mixed digit strings
JP3524189B2 (en) Character processor
JP2574741B2 (en) Language processing method