Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JPH0122648B2 - - Google Patents
[go: Go Back, main page]

JPH0122648B2 - - Google Patents

Info

Publication number
JPH0122648B2
JPH0122648B2 JP55136203A JP13620380A JPH0122648B2 JP H0122648 B2 JPH0122648 B2 JP H0122648B2 JP 55136203 A JP55136203 A JP 55136203A JP 13620380 A JP13620380 A JP 13620380A JP H0122648 B2 JPH0122648 B2 JP H0122648B2
Authority
JP
Japan
Prior art keywords
character
characters
headword
word
match
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP55136203A
Other languages
Japanese (ja)
Other versions
JPS5760464A (en
Inventor
Kunio Yoshida
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP55136203A priority Critical patent/JPS5760464A/en
Publication of JPS5760464A publication Critical patent/JPS5760464A/en
Publication of JPH0122648B2 publication Critical patent/JPH0122648B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Description

【発明の詳細な説明】[Detailed description of the invention]

本発明は、電子式手段にてあらかじめ記憶され
ている多数の見出し語の中から入力された語と一
致するものを検出しその一致した見出し語と対応
して記憶されている情報を出力しうるようにした
電子装置に適用されるものであつて、見出し語と
入力された語の一致を検出する装置に関する。 例えば英和型電子式辞書においては、見出し語
として英単語を記憶させると共にそれに対応させ
てその英単語の日本語訳も記憶させておき、英単
語が入力されるとそれと一致する見出し語を多数
の見出し語の中から見出しそれに対応する日本語
訳を出力する。このような装置においては、見出
し語や訳語等を記憶させる場合、記憶密度を向上
させるため、頻度の高い文字列、例えば英単語に
おけるstやingなどを1個の文字のようにコード
化し、一致検出時に圧縮されたコードを元のstや
ingに戻して一致を検出する方法、或いは、入力
された文字列を見出し語の圧縮ルールと同じ手法
で圧縮しそれで一致を検出するなどの方法が用い
られる。しかしながら、これらの手法はいずれも
入力された語と見出し語の文字列の完全な一致を
検出しているにすぎない。 一方、英語に限らず、見出し語については全く
同じ意味をもつ語であつても綴りが異なるもの
や、綴りの一部の文字や記号が欠落したものが習
慣上の表記法として慣用されている場合があり、
入力された綴りの通りに特定してしまうほうが望
ましくないケースが存在する。 例えば、同義語であつて綴りの異なるものとし
てGRAY/GREY等があり、綴りの一部を省略
しても同義語となるものとしてF.O.B/FOB等が
ある。このように、2種又はそれ以上の表記法が
存在する場合、完全な文字列の一致を検出する方
法では例えばF.O.BもFOBもすべての表記法によ
る語を見出し語として収録せねばならない。しか
しこのような方法では実質的に一語であるにもか
かわらず二語又は三語以上の語を収録せねばなら
ず、その分だけ記憶のためのスペースが必要とな
る。 本発明は、見出し語と入力された語の一致を検
出するとき、見出し語を構成する文字列のうちあ
る特定の文字又は記号を一致検出の対象から除外
することにより、例えばF.O.B/FOBのように表
記法が2種ありその一方から他方の文字列の一部
を省略した形になつている語を一語分の記憶スペ
ースにて収録させ、いずれの表記法で入力されて
も非収録語として処理されないようにしたもので
ある。 本発明の対象となる同義語を英語について例示
すると次のようなものがある。 1 .を省略した表記法のあるものの例 F.O.B/FOB P.M./PM O.K./OK 2 Eを省略した表記法のあるものの例 JUDGEMENT/JUDGMENT COOD−
BYE/GOOD−BY 3 Uを省略した表記法のあるものの例 LABOUR/LABOR COLOUR/COLOR
HONOUR/HONOR 4 その他の例 TRAVELLER/TRAVELER WAGGON/
WAGON OMELLETE/OMELET
ROUMANIA/RUMANIA また、日本語について例示すると次のようなも
のがある。なお、濁音記号そのものが通常1個の
文字として扱われる。 1 〃(濁音)を省略した表記法のあるものの例 アメジスト/アメシスト スムーズ/スムース 2 オを付加した表記法のあるものの例 チヤ(茶)/オチヤ(お茶) カアサン(母さ
ん)/オカアサン(お母さん) 3 その他の例 ワタクシ/ワクシ トランジスター/トランジ
スタ マトリツクス/マトリクス 第1図に本発明を英単語を日本語に翻訳する装
置置に実施した実施例の全体のブロツク構成図を
示す。 入力装置1はアルフアベツトA〜Z、ドツト・
ハイフン−等の記号を入力する入力キーを備えて
いる。翻訳指示キー2は入力装置1から英単語の
綴りを入力したのち日本語訳の表示を求めるとき
に操作するキーであつて、このキー入力によりア
ドレスカウンタ5をリセツトする。第1のメモリ
ー3は見出し語となる英単語を記録し、第2のメ
モリー4は各英単語に対応して日本語訳を記憶す
る。メモリ3,4のアドレスを指示するアドレス
カウンタ5は、アドレスに対応してメモリー3,
4から英単語とそれぞれに対応する日本語訳を読
み出す。一致検出装置6は、入力装置1から入力
された英単語とメモリーから出力された見出し語
を一時的に記憶するレジスタを備えその両者を比
較して、一致したときは一致信号7を出力し、一
致しないときは非一致信号8を出力する。表示装
置9は一致信号7が与えられたときメモリー4の
出力内容を表示する。 このような装置において、入力装置1から語が
入力されると、一致検出装置6内のレジスタにそ
の語が記憶され、次に翻訳指示キー2が操作され
ると、アドレスカウンタ5はリセツトされて最初
の語のアドレスを指示する従つて、第1のメモリ
ー3は最初のアドレスに記憶されている英単語を
出力し一致検出装置6内のもう一つのレジスタに
その英単語が記憶される。入力語と見出し語が一
致しないときは一致検出装置6が非一致信号8を
出力し、これに従つて、アドレスカウンタ5は前
進し次の見出し語を指示する。このような動作を
繰返し、入力語と見出し語が一致すると、一致検
出装置が一致信号7を出力し、アドレスカウンタ
5の歩進が停止し、第2のメモリー4の出力すな
わち入力語に対応する日本語訳を表示する。 非一致のまま最後のアドレスまで歩進するとア
ドレスカウンタ5が非収録としての処理を行う信
号(図示せず)を出力する。 第2図に、第1図の一致検出装置6の具体的構
成を示す。図において11はメモリー3から読出
された見出し語を記憶するレジスタ、12は入力
装置1から入力された入力語を記憶するレジスタ
である。これらのレジスタ11,12に語を記憶
させる場合、文字や記号は表1に示した通りコー
ド化されて記憶され、文字列の最後尾には
The present invention is capable of detecting a word that matches an input word from among a large number of headwords stored in advance by electronic means, and outputting stored information corresponding to the matched headword. The present invention is applied to such electronic devices, and relates to a device for detecting a match between a headword and an input word. For example, in an English-Japanese electronic dictionary, an English word is stored as a headword, and a corresponding Japanese translation of the English word is also stored. Outputs the Japanese translation corresponding to the heading from among the heading words. In such devices, when storing headwords, translations, etc., in order to improve storage density, frequently occurring character strings, such as st and ing in English words, are encoded as single characters and matched. At the time of detection, the compressed code is converted to the original st or
ing to detect a match, or compress the input character string using the same method as the headword compression rule and then detect a match. However, all of these methods only detect a complete match between the input word and the character string of the headword. On the other hand, not only in English, but for headwords, words with the exact same meaning but spelled differently or with some letters or symbols missing are commonly used as a customary notation. There are cases,
There are cases where it is undesirable to specify the spelling exactly as entered. For example, there are synonyms with different spellings such as GRAY/GREY, and there are synonyms such as FOB/FOB that are synonymous even if a part of the spelling is omitted. In this way, when two or more types of notation exist, in a method for detecting a complete character string match, for example, words in all the notations for FOB and FOB must be recorded as headwords. However, in this method, it is necessary to record two or three or more words even though it is actually one word, and storage space is required accordingly. When detecting a match between a headword and an input word, the present invention eliminates certain characters or symbols from the character strings that make up the headword, such as FOB/FOB. There are two types of notation, and words that omit part of the character string from one of them are recorded in one word's worth of memory space, and no matter which type of notation is input, unrecorded words will be recorded. This is to prevent it from being processed as . Examples of synonyms in English that are the subject of the present invention are as follows. 1. Examples of notations that omit ``FOB/FOB PM/PM OK/OK 2 Examples of notations that omit ``E'' JUDGEMENT/JUDGMENT COOD-
BYE/GOOD-BY 3 Examples of notations that omit U LABOUR/LABOR COLOUR/COLOR
HONOUR/HONOR 4 Other examples TRAVELER/TRAVELER WAGGON/
WAGON OMELLETE/OMELET
ROUMANIA/RUMANIA In addition, examples of Japanese include the following. Note that the voiced sound symbol itself is usually treated as one character. 1 Examples of writings that omit the 〃 (voiced sound) Amethyst/Amethyst Smooth/Smooth 2 Examples of writings that add O (cha)/Ochiya (tea) Kaasan (mother)/Okaasan (mother) 3 Other Examples Transistor/Transistor Matrix/Matrix FIG. 1 shows an overall block diagram of an embodiment in which the present invention is implemented in a device for translating English words into Japanese. The input device 1 is alphabetic A to Z, dots, etc.
It is equipped with an input key for inputting symbols such as a hyphen. The translation instruction key 2 is a key operated when requesting to display the Japanese translation after inputting the spelling of an English word from the input device 1, and the address counter 5 is reset by inputting this key. The first memory 3 records English words serving as headwords, and the second memory 4 stores Japanese translations corresponding to each English word. An address counter 5 that indicates the address of the memories 3 and 4 corresponds to the address of the memories 3 and 4.
Read out the English words and their corresponding Japanese translations from 4. The match detection device 6 includes a register that temporarily stores the English word input from the input device 1 and the entry word output from the memory, compares the two, and outputs a match signal 7 when they match. If they do not match, a non-match signal 8 is output. The display device 9 displays the output contents of the memory 4 when the coincidence signal 7 is applied. In such a device, when a word is input from the input device 1, that word is stored in a register in the match detection device 6, and when the translation instruction key 2 is operated next, the address counter 5 is reset. Indicating the address of the first word, the first memory 3 therefore outputs the English word stored at the first address and another register in the match detection device 6 stores that English word. When the input word and the entry word do not match, the match detection device 6 outputs a non-match signal 8, and in accordance with this, the address counter 5 advances and indicates the next entry word. When such an operation is repeated and the input word and the entry word match, the match detection device outputs a match signal 7, the address counter 5 stops advancing, and the output of the second memory 4, that is, corresponds to the input word. Display Japanese translation. If the address advances to the last address without a match, the address counter 5 outputs a signal (not shown) for processing as non-recording. FIG. 2 shows a specific configuration of the coincidence detection device 6 of FIG. 1. In the figure, 11 is a register that stores the headword read out from the memory 3, and 12 is a register that stores the input word input from the input device 1. When storing words in these registers 11 and 12, the characters and symbols are encoded and stored as shown in Table 1, and the last part of the string is

【表】【table】

【表】 表2に示す制御コードが、語がレジスタ11,1
2に記憶される毎に覚え込まれる。例えば、
APPLEがメモリー3又は入力装置1から出力さ
れレジスタに導入されると、レジスタ11又は1
2は第3図に示すようにAPPLEの末尾の次の桁
(斜線で示す)に制御コードを記憶する。なおこ
の制御コード入力回路は第2図に表わしていな
い。 第2図において13はレジスタ11に記憶され
ている語の文字列を指示するアドレスカウンタ、
14はレジスタ12に記憶されている語の文字列
を指示するアドレスカウンタである。これらのア
ドレスカウンタ13,14は新しい見出し語がレ
ジスター11に導入される毎に“0”文字目を指
示し、ANDゲート27及びORゲート33の出力
により次の文字のアドレスを指示する。そしてレ
ジスタ11及び12はアドレスカウンタ13及び
14で指示されているアドレスの文字を出力す
る。15は制御コード検出回路であつて、レジス
タ11から出力されているコードが制御コードで
あるときこれを検出して信号19を出力する。1
6は文字の第0ビツトが“0”であることを検出
する回路であつて、これを検出したとき信号20
を出力する。17はレジスタ11及び12から出
力されている文字の第1ビツト乃至第7ビツトの
内容がそれぞれ一致しているとき信号21を出力
する。18は制御コード検出回路であつて、レジ
スタ12から出力されているコードが制御コード
であるときこれを検出して信号22を出力する。
23,24,25,26はインバータ(NOT論
理回路)、27,28,29,30,31,32
はANDゲート回路、33,34はORゲート回
路、7及び8は第1図と同じ一致信号、非一致信
号である。 第4図は、第1図のメモリー3に見出し語を記
憶させる手法をF.O.B/FOB及び
OMELLETTE/OMELETを例に挙げて示して
いる。見出し語を記憶させる場合、表1に示した
ように完全一致文字コードと省略可文字コー
ドの2種類の文字コードを用いる。F.O.B/FOB
の場合、省略していない表記法即ちF.O.Bのうち
省略できないものFOBについてはのコードを
用い、省略できるもの即ち3個のドツトについて
はのコードを用いる。OMELLETE/
OMELETも同様であるが同じ文字が並びそのい
ずれはを省略されうる形(LL→L、TT→T)の
場合は、後の文字を省略可文字として取扱う。こ
のようにして見出し語をメモリー3に記憶させ
る。なお、第4図の※印はのコード化に従つた
文字を示し、( )は省略可文字コードを用いる
べき文字、記号を示している。以下のコード化
による文字は( )を付加して表わす。 次に第2図の回路構成の作用を第5図を参照し
ながら説明する。第1図の入力装置1から例えば
ABLEが入力されたものとする。ABLEはレジス
タ12に記憶されるが、最後尾の文字“E”の次
に制御コードを伴う。次に翻訳指示キー2の操作
によりメモリー3,4のアドレスカウンタ5はリ
セツトされ、メモリー3に記憶されている最初の
見出し語、例えばABHORが出力され、それがレ
ジスタ11に記憶される。この場合も制御コード
を伴う。この状態を第5図1に示す。また、新し
い見出し語がレジスタ11に記憶されたためレジ
スタ11,12のアドレスカウンタ13,14は
リセツトされ、レジスタ11,12の第0文字目
の内容を出力させる。なお、レジスタ11に記憶
される語はいずれも省略できない文字でありの
コードでコード化されている。レジスタ11,1
2の第0文字目の出力はいずれも“A”であるか
ら一致検出装置17の出力21が“1”となる。
このとき他の検出回路15,16,18は出力し
ない。従つて、ANDゲート27が開きアドレス
カウンタ14を歩進させるとともに、ORゲート
33を経てもう一つのアドレスカウンタ13をも
歩進させる。アドレスカウンタ13,14は次の
文字即ち第1文字を指示する。レジスタ11から
文字“B”が出力され、レジスタ12からも文字
“B”が出力されて前回と同様に一致検出装置1
7が出力しANDゲート27、ORゲート33が開
いてアドレスカウンタ13,14を共に歩進さ
せ、次の文字“H”及び“L”を出力させる。こ
のときは検出回路15,16,17,18のいず
れの出力も“O”であるから、ANDゲート31
が開きORゲート34を経て非一致信号8を出力
する。 この非一致信号の結果アドレスカウンタ5は次
の見出し語を出力し、同様に非一致信号がくり返
され、やがてメモリー3から見出し語として
ABLEが出力されレジスタ11に記憶される。前
述の説明と同様、第0文字目から順次一文字づつ
比較され、最終文字“E”までの一致したのち、
制御コードが両レジスタ11,12から出力され
ると制御コード検出回路15及び18が共に検出
信号19,22を出力し、ANDゲート32が開
かれて一致検出信号7が出力される。 次の例として、入力装置1からMEETが入力
され、これに対し見出し語としてメモリー3から
MEが出力されたものとする。第5図2に示すよ
うに、第0文字、第1文字目は共にMEであるか
らANDゲート27が開き、次の第2文字目の比
較においてレジスタ11からは制御コードが出力
されレジスタ12はEを出力する。従つて検出回
路は15のみが出力“1”となり、ANDゲート
29が開きORゲート34を経て非一致信号8が
出力される。 次に、F.O.B/FOBの入力について説明する。
この場合はF.O.B又はFOBの両方の入力を可とす
るため、見出し語は第4図Aに示す通りにコード
化されている。 まず、F.O.Bと入力した場合は、第5図3に示
すように、レジスタ11にF(・)O(・)B(・)
が制御コードを伴つて記憶され、レジスタ12に
はF.O.Bが制御コードを伴つて記憶される。アド
レスカウンタ13,14が第1文字目を指示した
とき(・)コードの第0ビツトは“0”であるか
ら検出回路16が出力し、また、第1文字目の第
1〜第7ビツトは一致するから検出回路17も出
力する。従つて、ANDゲート27のみ開かれア
ドレスカウンタ13,14をそれぞれ歩進させ
る。このように、レジスタ11のある桁に省略可
文字コードがある場合、レジスタ12の同じ桁の
第0ビツトが“1”であつても第1〜第7ビツト
が同一であれば同一文字であると判断され一致検
出信号7が出力される。 次にドツトを省いて単にFOBと入力した場合、
レジスタ11及び12の内容は第5図4に示す通
りである。この場合、第1文字(・)と0がそれ
ぞれ出力されると検出回路16の出力20のみが
“1”となるからANDゲート28が開き、ORゲ
ート33を経て一方のアドレスカウンタ13だけ
が歩進する。その結果0と0の比較が行われるこ
ととなる。このように、レジスタ11が省略可文
字コードのときであつて且つ両レジスタ11,1
2の第1〜第7ビツトの内容が異なるときは、
ANDゲート28のみが開かれて見出し語に係る
アドレスカウンタ13だけが歩進するから省略可
文字コードだけが一文字分桁送りされたことにな
り、最後に一致検出信号7が出力される。 本発明によれば、上述したように、見出し語メ
モリーにあらかじめ省略可文字を判別できるコー
ドで記憶しておき、見出し語と入力語の一致検出
装置において省略可文字が現われたとき、これが
それに対応する桁の入力語の文字と一致するとき
はそのまま一致するものと判別し、一致しないと
きは省略可文字のみを桁送りして次の文字との比
較を行うことができるので、いくつかの同義語を
見出し語メモリー内に重複して記憶させておかな
くとも、検索にもれになることなく見出し語を見
つけ出すことができ、メモリー容量を可及的に小
型化し且つ信頼性を高めることができる。
[Table] The control code shown in Table 2 is the word register 11,1.
It is memorized every time it is memorized in 2. for example,
When APPLE is output from memory 3 or input device 1 and introduced into the register, register 11 or 1
2 stores a control code in the next digit (indicated by diagonal lines) after the end of APPLE, as shown in FIG. Note that this control code input circuit is not shown in FIG. In FIG. 2, 13 is an address counter that indicates the character string of the word stored in the register 11;
14 is an address counter that indicates the character string of the word stored in the register 12; These address counters 13 and 14 indicate the "0" character each time a new headword is introduced into the register 11, and the outputs of the AND gate 27 and OR gate 33 indicate the address of the next character. Registers 11 and 12 then output the characters at the addresses indicated by address counters 13 and 14. Reference numeral 15 denotes a control code detection circuit which detects when the code output from the register 11 is a control code and outputs a signal 19. 1
6 is a circuit that detects that the 0th bit of a character is "0", and when this is detected, a signal 20 is output.
Output. 17 outputs a signal 21 when the contents of the first to seventh bits of the characters output from registers 11 and 12 respectively match. Reference numeral 18 denotes a control code detection circuit which detects when the code output from the register 12 is a control code and outputs a signal 22.
23, 24, 25, 26 are inverters (NOT logic circuits), 27, 28, 29, 30, 31, 32
is an AND gate circuit, 33 and 34 are OR gate circuits, and 7 and 8 are the same signal and non-coincidence signal as in FIG. Figure 4 shows the method of storing headwords in memory 3 in Figure 1 using FOB/FOB and
OMELETTE/OMELET is shown as an example. When storing a headword, two types of character codes are used, as shown in Table 1: a complete match character code and an omissible character code. FOB/FOB
In the case of , use the non-abbreviated notation, that is, the code for the FOB that cannot be omitted, and use the code for the notation that can be omitted, that is, the three dots. OMELLETE/
The same is true for OMELET, but if the same letters are lined up and one of them can be omitted (LL→L, TT→T), the latter character is treated as an omissible character. In this way, the headword is stored in the memory 3. Note that the asterisk (*) in Figure 4 indicates characters that follow the encoding, and the parentheses () indicate characters and symbols that should use the optional character code. Characters in the following encodings are represented by adding parentheses. Next, the operation of the circuit configuration shown in FIG. 2 will be explained with reference to FIG. For example, from the input device 1 in FIG.
Assume that ABLE has been input. ABLE is stored in register 12, with a control code following the last character "E". Next, by operating the translation instruction key 2, the address counters 5 of the memories 3 and 4 are reset, and the first headword stored in the memory 3, for example ABHOR, is output and stored in the register 11. A control code is also included in this case. This state is shown in FIG. Further, since the new headword has been stored in register 11, address counters 13 and 14 of registers 11 and 12 are reset, and the contents of the 0th character of registers 11 and 12 are output. Note that each word stored in the register 11 is coded with a character that cannot be omitted. register 11,1
Since the outputs of the 0th character of 2 are both "A", the output 21 of the match detection device 17 is "1".
At this time, the other detection circuits 15, 16, and 18 do not output. Therefore, the AND gate 27 opens and increments the address counter 14, and also increments the other address counter 13 via the OR gate 33. Address counters 13 and 14 indicate the next character, ie, the first character. The character "B" is output from the register 11, the character "B" is also output from the register 12, and the match detection device 1 is outputted as before.
7 is output, AND gate 27 and OR gate 33 are opened to increment both address counters 13 and 14, and output the next characters "H" and "L". At this time, since all outputs of the detection circuits 15, 16, 17, and 18 are "O", the AND gate 31
opens and outputs the non-coincidence signal 8 via the OR gate 34. As a result of this non-matching signal, the address counter 5 outputs the next headword, the same non-matching signal is repeated, and eventually the memory 3 outputs the next headword.
ABLE is output and stored in register 11. As in the previous explanation, the characters are compared one by one starting from the 0th character, and after a match is made up to the final character "E",
When the control code is output from both registers 11 and 12, control code detection circuits 15 and 18 both output detection signals 19 and 22, AND gate 32 is opened and coincidence detection signal 7 is output. In the following example, MEET is input from input device 1, and MEET is input from memory 3 as a headword.
Assume that ME has been output. As shown in FIG. 5, the 0th character and the 1st character are both ME, so the AND gate 27 is opened, and when the next 2nd character is compared, the control code is output from the register 11 and the register 12 is Outputs E. Therefore, only the detection circuit 15 outputs "1", the AND gate 29 is opened, and the non-coincidence signal 8 is outputted via the OR gate 34. Next, FOB/FOB input will be explained.
In this case, since it is possible to input FOB or both, the headword is coded as shown in FIG. 4A. First, if you input FOB, as shown in Figure 5, F(・)O(・)B(・)
is stored with a control code, and the FOB is stored in register 12 with a control code. When the address counters 13 and 14 indicate the first character, the detection circuit 16 outputs it because the 0th bit of the (.) code is "0", and the 1st to 7th bits of the first character are Since they match, the detection circuit 17 also outputs an output. Therefore, only AND gate 27 is opened to increment address counters 13 and 14, respectively. In this way, if there is an optional character code in a certain digit of register 11, even if the 0th bit of the same digit in register 12 is "1", if the 1st to 7th bits are the same, the characters are the same. It is determined that the coincidence detection signal 7 is output. Next, if you omit the dot and simply enter FOB,
The contents of registers 11 and 12 are as shown in FIG. In this case, when the first character (.) and 0 are output, only the output 20 of the detection circuit 16 becomes "1", so the AND gate 28 opens and only one address counter 13 steps through the OR gate 33. proceed. As a result, a comparison between 0 and 0 is performed. In this way, when register 11 is an optional character code and both registers 11 and 1
When the contents of the 1st to 7th bits of 2 are different,
Since only the AND gate 28 is opened and only the address counter 13 related to the headword is incremented, only the omissible character code is shifted by one character, and finally the match detection signal 7 is output. According to the present invention, as described above, an omissible character is stored in the headword memory in advance as a code that can be determined, and when an omissible character appears in the match detection device between a headword and an input word, this corresponds to the omitted character. If it matches the character of the input word in the digit, it is judged as a match, and if it does not match, only the optional character is shifted and the comparison with the next character can be performed. Even without storing words redundantly in the headword memory, headwords can be found without being omitted in searches, reducing memory capacity as much as possible and increasing reliability. .

【図面の簡単な説明】[Brief explanation of drawings]

第1図は本発明実施例の全体構成を示すブロツ
ク図である。第2図は第1図の一致検出装置6の
内部構成を示すブロツク図である。第3図は第2
図のレジスタ11,12内における語の構成を説
明する図である。第4図は見出し語のビツト構成
を例示する図である。第5図は第2図の作用説明
図である。 1……入力装置、3……見出し語のメモリー、
4……見出し語に対応するデータのメモリー、5
……アドレスカウンタ、6……一致検出装置、9
……出力装置、11……見出し語のレジスタ、1
2……入力語のレジスタ、15,16,17,1
8……検出回路。
FIG. 1 is a block diagram showing the overall configuration of an embodiment of the present invention. FIG. 2 is a block diagram showing the internal configuration of the coincidence detection device 6 of FIG. 1. Figure 3 is the second
FIG. 2 is a diagram illustrating the structure of words in registers 11 and 12 in the figure. FIG. 4 is a diagram illustrating the bit structure of a headword. FIG. 5 is an explanatory diagram of the operation of FIG. 2. 1... Input device, 3... Memory for headwords,
4...Memory of data corresponding to headword, 5
... Address counter, 6 ... Match detection device, 9
...Output device, 11...Headword register, 1
2...Input word register, 15, 16, 17, 1
8...Detection circuit.

Claims (1)

【特許請求の範囲】[Claims] 1 メモリー内にあらかじめ記憶されている多数
の見出し語の中から入力語と一致する語を検出し
その一致した見出し語と対応して記憶されている
情報を出力するようにした電子装置において、省
略可文字と完全一致文字とで構成された見出し語
を記憶するメモリーと、上記メモリーが記憶する
見出し語の省略可文字とを判別する判別手段と、
見出し語を構成する文字が省略可文字であつて入
力語の構成文字と一致しないとき上記省略可文字
を桁送りして次の文字と上記入力語の構成文字と
を比較する比較手段とを備えたことを特徴とする
見出し語一致検出装置。
1. In an electronic device that detects a word that matches an input word from among a large number of headwords pre-stored in a memory and outputs stored information corresponding to the matched headword, a memory for storing headwords composed of allowed characters and exact matching characters; and a determining means for determining omissible characters of headwords stored in the memory;
Comparison means for shifting the optional character and comparing the next character with the constituent characters of the input word when the characters constituting the headword are optional characters and do not match the constituent characters of the input word. A headword matching detection device characterized by:
JP55136203A 1980-09-29 1980-09-29 Keyword coincidence detecting device Granted JPS5760464A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP55136203A JPS5760464A (en) 1980-09-29 1980-09-29 Keyword coincidence detecting device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP55136203A JPS5760464A (en) 1980-09-29 1980-09-29 Keyword coincidence detecting device

Publications (2)

Publication Number Publication Date
JPS5760464A JPS5760464A (en) 1982-04-12
JPH0122648B2 true JPH0122648B2 (en) 1989-04-27

Family

ID=15169737

Family Applications (1)

Application Number Title Priority Date Filing Date
JP55136203A Granted JPS5760464A (en) 1980-09-29 1980-09-29 Keyword coincidence detecting device

Country Status (1)

Country Link
JP (1) JPS5760464A (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58195231A (en) * 1982-05-08 1983-11-14 Sanyo Electric Co Ltd Word processor
JPS62138925A (en) * 1985-12-12 1987-06-22 Fujitsu Ltd Data retrieval system
JPH05189485A (en) * 1992-01-09 1993-07-30 Pfu Ltd Keyword retrieval system

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS4966048A (en) * 1972-10-27 1974-06-26
JPS54104747A (en) * 1978-02-03 1979-08-17 Canon Inc Small sized electronic unit

Also Published As

Publication number Publication date
JPS5760464A (en) 1982-04-12

Similar Documents

Publication Publication Date Title
JPH0533422B2 (en)
US4374625A (en) Text recorder with automatic word ending
US3465299A (en) Information translating data comparing systems
JPS62251876A (en) Language processing system
JPH0122648B2 (en)
JPS5918729B2 (en) Money Kanji conversion device
JPH0315221B2 (en)
Ikhsan et al. Search and Comparison of Isim Ma ‘rifat with Remove Diacritic in the Qur ‘an and Hadith of Abu Daud
JPS6336031B2 (en)
JPH0746362B2 (en) String matching method
JPS58219670A (en) Translation dictionary and dictionary search method using it
JPH0140370B2 (en)
JP3109187B2 (en) Morphological analysis method
JPS625728Y2 (en)
JPS58168180A (en) information retrieval device
JPS5814710B2 (en) pattern classification device
JPS5931099B2 (en) electronic dictionary
JPS5931102B2 (en) electronic dictionary
JPH01224831A (en) Character string retrieving device
JPS58146927A (en) Method for generating word dictionary having information on relative term
JPS60251459A (en) Input device of japanese character
JPS6128134A (en) Symbol string collecting device and its control system
JPS5931103B2 (en) electronic dictionary
JPS5924382A (en) Inflection method for electronic translators
JPS5931100B2 (en) electronic dictionary