JP2948159B2 - Database device - Google Patents
Database deviceInfo
- Publication number
- JP2948159B2 JP2948159B2 JP8326482A JP32648296A JP2948159B2 JP 2948159 B2 JP2948159 B2 JP 2948159B2 JP 8326482 A JP8326482 A JP 8326482A JP 32648296 A JP32648296 A JP 32648296A JP 2948159 B2 JP2948159 B2 JP 2948159B2
- Authority
- JP
- Japan
- Prior art keywords
- concept
- noun
- concepts
- relation
- knowledge base
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
【0001】[0001]
【産業上の利用分野】本発明は、一般のユーザが知織・
情報の検索や登録を判り易く、かつ容易に出来るように
するための自然言語インターフェースに係る。より具体
的には、そのような自然言語インターフェースを実現す
るための自然言語理解方式と、それを用いた知識ベース
方式に関する。特に、多種多様な事物や事実を記憶し
て、自然言語から推論を働かせて検索が出来るような知
識デ−タベースの構築法に関する。BACKGROUND OF THE INVENTION The present invention is intended for general users
The present invention relates to a natural language interface for making it easy to find and register information. More specifically, the present invention relates to a natural language understanding method for realizing such a natural language interface, and a knowledge base method using the same. In particular, the present invention relates to a method of constructing a knowledge database in which a variety of things and facts are stored and can be searched by inference from a natural language.
【0002】[0002]
【従来の技術】従来、自然言語を用いたヒューマンイン
ターフェースとしては、データベースのための自然言語
インターフェースが知られている。例えば、文献[ジー
・ジー・ヘンドリックス、他、"ディベロッピング・ア
・ナチュラル・ラングエッジ・インタフェース・トゥー
・コンプレックス・データ"、エーシーエム、トランザ
クション・データベース・システム、ボル3、197
8、ピーピー105−147(G. G. Hendrix et al.,
"Developing a Natural Language Interface to Compl
ex Data," ACM Trans. Database Systems, Vol. 3, 197
8, pp.105-147)]などがある。これらのシステムでは、
データベースのためのデータモデル(記憶するデータ項
目間の関係を表現する方式のこと)と、自然言語を解釈
するための文法や辞書とが独立に設定されている。すな
わち、自然言語インターフェースを既存のデータベース
に対して付加するときは、文法や辞書を改めて構築する
必要がある。或いは、対象とするデータベースが変われ
ば、自然言語インターフェースのための文法や辞書を変
更する必要があるという問題点がある。2. Description of the Related Art Conventionally, a natural language interface for a database is known as a human interface using a natural language. For example, see the literature [G. Hendrix, et al., "Developing a Natural Langedge Interface to Complex Data", ACM, Transaction Database System, Vol. 3, 197.
8, P.P. 105-147 (GG Hendrix et al.,
"Developing a Natural Language Interface to Compl
ex Data, "ACM Trans. Database Systems, Vol. 3, 197
8, pp. 105-147)]. In these systems,
A data model for a database (a method for expressing the relationship between stored data items) and a grammar and a dictionary for interpreting a natural language are set independently. That is, when adding a natural language interface to an existing database, it is necessary to construct a grammar and a dictionary anew. Alternatively, if the target database changes, the grammar and dictionary for the natural language interface need to be changed.
【0003】また、従来、自然言語インターフェースが
与えられているデータベースは関係データベース(Rela
tional Database)であり、そこで用いられる検索のた
めの形式言語、例えば準標準的なSQL言語(Structure
d Query Language:ストラクチャード・クエリ・ラング
エッジ)は高次の知識の記述能力に弱い。通常、自然言
語による質問文は、このような中間言語としての形式言
語に翻訳されるため、この形式言語の表現能力にシステ
ム全体の機能が制限されてしまうという問題点がある。
特に、関係データベースは一様なデータに対しては有効
であるが、多種多様な事物を扱うヘテロジェネオス・デ
ータベース(heterogeneous database)や、オブジェク
ト指向のデータベースに対しては、充分適しているとは
言えない。例えば、曖昧なユーザの記憶から事物を記述
して、その記述からそれに関する情報を検索することに
は適していない。Conventionally, a database provided with a natural language interface is a relational database (Rela
database, and a formal language for search used therein, such as a quasi-standard SQL language (Structure
d Query Language (structured query Langedge) is weak in the ability to describe higher-level knowledge. Usually, a question sentence in a natural language is translated into such a formal language as an intermediate language, so that there is a problem that the function of the entire system is limited by the expressive power of this formal language.
In particular, relational databases are effective for uniform data, but are not adequately suited for heterogeneous databases that handle a wide variety of things and object-oriented databases. I can not say. For example, it is not suitable for describing an object from an ambiguous user's memory and retrieving information about the object from the description.
【0004】更に、これらのシステムでは、データ(新
しい知識・情報)の入力は自然言語以外の方法を用いて
おり、専門家が行っている。従って、エンドユーザが直
接入力・登録することが難しいという問題点がある。Further, in these systems, input of data (new knowledge and information) uses a method other than natural language, and is performed by experts. Therefore, there is a problem that it is difficult for the end user to directly input and register.
【0005】[0005]
【発明が解決しようとする課題】本発明の解決しようと
する課題は、データベースや知識ベースにおいて、以上
のような問題点を解決し、エンドユーザが曖昧、または
断片的な記憶からでも自然言語による記述から欲しい情
報を検索可能とすることにある。更に、新しい情報や知
識の登録もユーザ自身により同様に自然言語を用いて行
えるようにすることにある。SUMMARY OF THE INVENTION The problem to be solved by the present invention is to solve the above problems in databases and knowledge bases so that end users can use natural language even from ambiguous or fragmentary memory. The purpose is to make it possible to retrieve desired information from a description. Another object of the present invention is to enable a user to register new information and knowledge by using a natural language in the same manner.
【0006】[0006]
【課題を解決するための手段】本発明は、かかる課題を
達成するために、知識ベースと自然言語インターフェー
スとに共通の知識表現基盤を与え、それにより自然言語
による知織・情報の検索と登録とを容易に実現可能とす
るものである。In order to achieve the above object, the present invention provides a common knowledge expression base for a knowledge base and a natural language interface, thereby searching and registering knowledge and information in natural language. Can be easily realized.
【0007】具体的には、本発明は、知識ベースの構成
法として、「概念」と「関係」とで事物の体系と事実を
表現する「概念関係モデル」と呼ぶ知識表現方式(デー
タベースにおけるデータモデルに対応する)を与え、更
に、同知識ベースの中に言語的知識をも記憶させる方式
を提供する。ここで、「概念」とは、事物や事象、或い
は抽象的な概念を表わす計算機内のデータ項目であり、
「関係」とは、同概念間に定義するデータ項目である。
概念はノード(節)で表わし、関係はリンク(辺)で表
わす。概念関係モデルで表された知識は、従って、概念
のネットワークを構成する。ここでは、これを概念ネッ
トワークと称する。More specifically, the present invention provides a knowledge expression method (data in a database) called a “concept relation model” that expresses a system of things and facts by “concepts” and “relationships” as a method of constructing a knowledge base. (Corresponding to the model), and a method for storing linguistic knowledge in the knowledge base is also provided. Here, the “concept” is a data item in a computer that represents an object, an event, or an abstract concept.
“Relation” is a data item defined between the concepts.
Concepts are represented by nodes (nodes), and relationships are represented by links (edges). The knowledge represented by the concept relation model thus constitutes a network of concepts. Here, this is called a concept network.
【0008】すなわち、本発明による知識ベースでは、
本来記憶したい知識とそれを言語的に表現するための知
識とを一体として概念ネットワークに格納し、自然言語
インターフェースは同知識を共用するようにすることが
特徴である。従って、原則として、自然言語インターフ
ェースのために改めて辞書などを構築する必要が無い。That is, in the knowledge base according to the present invention,
It is characterized in that knowledge to be originally stored and knowledge to express it linguistically are stored together in a concept network, and that the natural language interface shares the knowledge. Therefore, in principle, it is not necessary to newly construct a dictionary or the like for the natural language interface.
【0009】また、本発明は、知識ベースに記憶されて
いる事実などから推論を働かせて、自然言語で表わされ
た質問文の意味解釈を行う自然言語理解方式を提供す
る。特に、通常、我々が良く用いる複数の名詞の列から
なる複合名詞句の意味解釈方式を与える。複合名詞句を
意味解釈するためには、名詞間の関係をシステムが推論
する必要があるが、本発明では、知識ベース内に記憶さ
れている概念と関係のみを推論する方式を与える。The present invention also provides a natural language comprehension system for performing inference from facts and the like stored in a knowledge base to interpret the meaning of a question sentence expressed in a natural language. In particular, it usually gives a semantic interpretation method for compound noun phrases consisting of a series of nouns that we often use. In order to interpret a compound noun phrase, the system needs to infer the relation between nouns. In the present invention, however, a method for inferring only the concept and the relation stored in the knowledge base is provided.
【0010】更に、本発明による知識表現方式は、複数
の言語に適用することが容易になるように、言語に依存
する部分を限定している。更には、複数の言語による表
現の共存も可能にしている。従って、同一知識ベースに
おいて、例えば、英語と日本語で検索したり、登録した
りすることを可能とする手段を提供する。[0010] Furthermore, the knowledge expression method according to the present invention limits the language-dependent parts so that it can be easily applied to a plurality of languages. Furthermore, it enables the coexistence of expressions in multiple languages. Therefore, a means is provided that enables searching and registration in the same knowledge base in, for example, English and Japanese.
【0011】なお、単語間の意味関係を概念ネットワー
クを用いて表現し自然言語処理に利用する技術自体に関
しては、特開昭61−220027号公報がある。しか
し、本願発明は、検索対象のデ−タを概念ネットワーク
を用いて記憶するとともに、自然言語を解釈するための
知識情報も同じ概念ネットワークから抽出することを示
す。よって、デ−タの増大にともなって知識情報の量も
自動的に増大する。Japanese Patent Application Laid-Open No. 61-220027 discloses a technique for expressing the semantic relationship between words using a concept network and using the same for natural language processing. However, the present invention indicates that data to be searched is stored using a concept network, and that knowledge information for interpreting a natural language is also extracted from the same concept network. Therefore, the amount of knowledge information automatically increases as the data increases.
【0012】これにより、別個に解釈用の知識ファイル
を設けた場合における、デ−タベースとは別に行なわな
ければならない知識ファイルのメンテナンスの問題を解
消することができる。Thus, the problem of maintenance of the knowledge file which must be performed separately from the database when the knowledge file for interpretation is provided separately can be solved.
【0013】[0013]
【作用】以下、本発明方式の原理を説明する。The principle of the present invention will be described below.
【0014】まず、基本となる概念関係モデルによる知
識表現方式を説明する。図2に概念ネットワークの一部
を説明のために示す。同図において、楕円は概念(ノー
ド)を表わし、矢印は関係(リンク)を表わす。ノード
201、"UNIVERSAL" は知識ベース内の全て
を代表するルートノード(根)である。各ノードには一
つ以上の文字列を概念の名称として定義できる。例え
ば、同義語や外国語を付加することができる。First, a description will be given of a knowledge expression method based on a basic concept relation model. FIG. 2 shows a part of the concept network for explanation. In the figure, an ellipse represents a concept (node), and an arrow represents a relationship (link). Node 201, "UNIVERSAL" is a root node (root) that represents everything in the knowledge base. Each node can define one or more character strings as concept names. For example, synonyms and foreign languages can be added.
【0015】一方、ノードとノードを結ぶリンクには、
属性が継承される概念間に定義される包摂関係(IS−
Aリンク202)、概念間に一般的に定義される「一般
関係」(ノード203)、および同一般関係の具体的事
例としての「具体関係」(リンク204)がある。包摂
関係は物のクラス(分類)を表わす。従って、概念と包
摂関係からなる概念ネットワークは、分類階層(taxonom
ic hierarchy)を表わす概念木を構成する。On the other hand, the links connecting the nodes include:
Inclusive relations defined between concepts whose attributes are inherited (IS-
A link 202), a “general relationship” (node 203) generally defined between concepts, and a “specific relationship” (link 204) as a specific example of the general relationship. The subsumption relation indicates the class (classification) of an object. Therefore, a concept network consisting of concepts and inclusive relationships is a taxonomic hierarchy (taxonom
ic hierarchy).
【0016】例えば、図2の概念ネットワークの内、概
念木は次のような知識を表わしている。For example, in the concept network of FIG. 2, the concept tree represents the following knowledge.
【0017】 (PAPER-MATERIAL (is-a THING)) (BOOK (is-a PAPER-MATERIAL)) (BOOK#0051 (is-a BOOK)) (LIVING-THING (is-a THING)) (PERSON (is-a LIVING-THING)) (NEWTON (is-a PERSON)) ここで、これらはフレーム表現と呼ばれる。ここでは、
LISP言語で使うS式表現(Symbolic expression)
で表わしている。これらは普通の英語でも表わすことが
可能であり、 Paper material is a thing. Book is a paper material. などと書ける。日本語では、「書物は物である。」「本
は書物である。」「人は生物である。」などとなる。(PAPER-MATERIAL (is-a THING)) (BOOK (is-a PAPER-MATERIAL)) (BOOK # 0051 (is-a BOOK)) (LIVING-THING (is-a THING)) (PERSON ( is-a LIVING-THING)) (NEWTON (is-a PERSON)) Here, these are called frame representations. here,
Symbolic expression used in LISP language
It is represented by These can be expressed in ordinary English, and can be written as Paper material is a thing. Book is a paper material. In Japanese, "books are things.""Books are books.""People are living things."
【0018】一般関係の例は、図2において、概念21
1(BOOK)と概念212(PERSON)との間に
定義される関係203である。これは「本」と「人」と
の間には「著者」または「著作」という関係が有り得る
ことを表わしている。この一般関係は、 (BOOK (is-written-by PERSON)) (PERSON (has-written BOOK)) または、 「本を書いた人」 「人が書いた本」 のように、右方向、或いは左方向へ双方向に読むことが
出来る。An example of a general relationship is shown in FIG.
1 (BOOK) and a concept 203 defined between the concept 212 (PERSON). This indicates that there may be a relationship between "book" and "person" such as "author" or "work". The general relationship is (BOOK (is-written-by PERSON)) (PERSON (has-written BOOK)) or right or left, such as "the person who wrote the book" or "the book that the person wrote." You can read in both directions.
【0019】具体関係は、図2において、破線のリンク
204で示されるような関係であり、ある一般関係の一
つの具体的(データベースでは実現値とも言う)を示
す。例えば、図2では、「著者」という一般関係203
の具体例として、概念213と概念214との間に具体
関係204が定義されている。フレーム表現で書くと、 となる。自然言語では、 BOOK#0051 is a book which is written by NEWTON. NEWTON is a person who has written BOOK#0051. 「BOOK#0051はNEWTONが書いた本であ
る。」 「NEWTONはBOOK#0051を書いた人であ
る。」 のように表わすことが出来る。The specific relationship is a relationship shown by a broken line link 204 in FIG. 2, and shows one specific example of a general relationship (also referred to as an actual value in a database). For example, in FIG.
As a specific example, a concrete relationship 204 is defined between the concept 213 and the concept 214. When writing in frame expression, Becomes In natural language, BOOK # 0051 is a book which is written by NEWTON. NEWTON is a person who has written BOOK # 0051. "BOOK # 0051 is a book written by NEWTON.""NEWTON wrote BOOK # 0051. It is a person. "
【0020】さて、以上のような知識は、本発明方式で
は以下のようなデータ構造で記憶する。まず、概念とそ
の名称は概念名称テーブル221(図3)で記憶する。
同テーブル221は、三つのカラム222、223、2
24から成っている。カラム222は概念の固有番号C
#であり、カラム223にその名称CNAMEを定義で
きる。同名称の言語LANGはカラム224で規定す
る。例えば、LANGの値が "J" のときは同名称は日
本語、 "E" のときは英語である。The above knowledge is stored in the following data structure in the method of the present invention. First, the concept and its name are stored in the concept name table 221 (FIG. 3).
The table 221 has three columns 222, 223, 2
Consists of 24. Column 222 is the unique number C of the concept.
#, And the name CNAME can be defined in the column 223. The language LANG of the same name is defined in column 224. For example, when the value of LANG is "J", the name is Japanese, and when it is "E", it is English.
【0021】また、概念名称は、同一言語に対して複数
個、定義することが出来る。そのために、カラム223
はデータ構造としてデータの繰返しを許している。例え
ば、概念C#0004の名称は「本」および "BOO
K" であるが、これに対して、概念名称「書籍」を追加
定義することも出来る。A plurality of concept names can be defined for the same language. Therefore, column 223
Allows data to be repeated as a data structure. For example, the name of concept C # 0004 is “book” and “BOO”
K ", the concept name" book "can be additionally defined.
【0022】次に、概念の包摂関係は、図4に示す包摂
関係テーブル231で表わす。カラム232とカラム2
33は、各々概念固有番号C#およびCS#であり、概
念C#の上位概念(Superconcept)は概念SC#である
ことを表わす。例えば、テーブル231の第2レコード
は、概念C#0002(「書物)」の上位概念は概念C
#0001(「事物」」であることを表わす。各概念に
定義される属性などの「関係」は、包摂関係のリンクを
通じて上位から下位へ継承される。ここで、一つの概念
に対して複数の上位概念を定義することが可能である。
従って、属性の多重継承が実現される。Next, the subsumption relation of the concept is represented by a subsumption relation table 231 shown in FIG. Column 232 and Column 2
Reference numeral 33 denotes a concept unique number C # and a CS #, respectively, and indicates that the superordinate concept (Superconcept) of the concept C # is the concept SC #. For example, the second record of the table 231 indicates that the superordinate concept of the concept C # 0002 (“book”) is the concept C # 0002.
# 0001 ("thing"). "Relationships" such as attributes defined for each concept are inherited from higher to lower levels through links of subsumption relations. It is possible to define a superordinate concept of
Therefore, multiple inheritance of attributes is realized.
【0023】包摂関係以外の概念間の多種多様な関係
は、図5で示す一般関係定義テーブル241に定義する
ことが出来る。個々の一般関係は各々、関係の種類を表
わす。基本的には、そのような関係の種類の数に制限は
無く、任意の数の一般関係を定義することが可能であ
る。A wide variety of relationships between concepts other than inclusive relationships can be defined in a general relationship definition table 241 shown in FIG. Each individual general relationship represents a type of relationship. Basically, there is no limit on the number of such relationship types, and it is possible to define any number of general relationships.
【0024】一般関係定義テーブル241は、主に「関
係」を自然言語で表現したときの「読み」を定義する。
カラム244は同関係を左から右へ読んだときの「読
み」LRであり、カラム245はその逆に右から左への
「読み」RLを定義する。これらのカラムは、データ構
造として繰返しを許容し、複数の読みを定義することが
出来る。また、これらは概念名称テーブルと同様にカラ
ム246によって読みの言語を指定することが出来る。
従って、複数の言語によって表現することが可能であ
る。The general relation definition table 241 mainly defines "reading" when "relation" is expressed in a natural language.
Column 244 is the “reading” LR when the relationship is read from left to right, and column 245 defines the “reading” RL from right to left. These columns allow repetition as a data structure and can define multiple readings. In addition, the reading language can be designated by the column 246 as in the concept name table.
Therefore, it is possible to express in a plurality of languages.
【0025】図5の例では、関係 "AUTHORSHIP" は、 PERSON who is author of BOOK PERSON who is the author of BOOK PERSON who wrote BOOK PERSON who has written BOOK 或いは、 BOOK whose author is PERSON BOOK by PERSON BOOK from PERSON BOOK of PERSON と自然言語(この場合は英語)で表現できる。日本語の
場合も同様である(省略)。In the example of FIG. 5, the relationship "AUTHORSHIP" is PERSON who is author of BOOK PERSON who is the author of BOOK PERSON who wrote BOOK PERSON who has written BOOK or BOOK whose author is PERSON BOOK by PERSON BOOK from PERSON It can be expressed in BOOK of PERSON and natural language (English in this case). The same is true for Japanese (omitted).
【0026】概念間の関係の存在は、図6に示す関係テ
ーブル251によって記憶する。これまでに説明したよ
うに、関係リンクには一般関係と具体関係とがあり、そ
れらはテーブル251のカラム256によって区別す
る。カラムCLASSの値がGRのときは一般関係、I
NSTのときは具体関係を表わす。図6の例では、第1
レコードは図2の一般関係203を表わし、第2レコー
ドは図2の具体関係204を表わす。また、カラムC#
Lは左側の概念を、カラムC#Rは右側の概念を規定す
る。ここで、ある概念を右に置くか左に置くかは、定義
次第であり、テーブル241とテーブル251とで矛盾
が無い限り、どちらに定義しても良い。The existence of a relationship between concepts is stored in a relationship table 251 shown in FIG. As described above, the relation link includes the general relation and the specific relation, which are distinguished by the column 256 of the table 251. General relation when the value of column CLASS is GR, I
NST indicates a specific relationship. In the example of FIG.
The record represents the general relationship 203 of FIG. 2, and the second record represents the concrete relationship 204 of FIG. In addition, column C #
L defines the concept on the left, and column C # R defines the concept on the right. Here, whether a certain concept is placed on the right or on the left depends on the definition, and either may be defined as long as there is no contradiction between the table 241 and the table 251.
【0027】さて、次に、以上の知識表現方式を基礎と
する自然言語理解方式の原理を説明する。Next, the principle of the natural language understanding system based on the above knowledge expression system will be described.
【0028】まず、オブジェクト指向の知識ベースで最
も重要な複合名詞句の意味理解方式を説明する。ここ
で、複合名詞句とは一部形容詞を含んだ複数の名詞の列
からなる名詞句である。例えば、以下は複合名詞句の例
である。First, a method of understanding the meaning of a compound noun phrase which is the most important in an object-oriented knowledge base will be described. Here, the compound noun phrase is a noun phrase composed of a sequence of a plurality of nouns including some adjectives. For example, the following is an example of a compound noun phrase.
【0029】 supercomputer article (1) ElectronicsWeek article (2) Japanese personal computer company (3) American personal computer software packages (4) ここで、意味を理解することは、各形容詞および名詞の
間の関係を陽に求めることである。Supercomputer article (1) ElectronicsWeek article (2) Japanese personal computer company (3) American personal computer software packages (4) Here, understanding the meaning explicitly seeks the relationship between each adjective and noun. That is.
【0030】例えば、複合名詞句(1)と(2)は同じ
構造をしているが、意味は異なり、次のように解釈され
るべきである。(1)は、 "article whose subject i
s supercomputer" のことであり、(2)は、 "articl
e which is part of ElectronicsWeek" を意味する。す
なわち、(1)では、articleとsupercomputerとが関係
subject-isで結ばれていること、(2)では、article
とElectronicsWeekが関係is-part-ofで結ばれているこ
とを推論する必要がある。フレーム形式で記述すると、
次のような構造を自動的に抽出することが意味を理解す
ることである。For example, the compound noun phrases (1) and (2) have the same structure but different meanings and should be interpreted as follows. (1) is "article whose subject i
s supercomputer "and (2) is" articl
e which is part of ElectronicsWeek ". In other words, in (1), article and supercomputer are related
connected by subject-is, (2), article
It is necessary to infer that ElectronicsWeek is connected with the relationship is-part-of. When you write in a frame format,
It is important to automatically extract the following structures.
【0031】 (ARTICLE (subject-is SUPERCOMPUTER)) (5) (ARTICLE (is part-of ElectronicsWeek)) (6) 本発明による自然言語理解方式では、図7に示すような
知識に基づいて、以下のように意味を解釈する。まず、
この推論を可能とする知識としては、一般関係として、
関係RS#0011: (ARTICLE (subject-is UNIVERSAL)) (7a) (UNIVERSAL (is subject-of ARTICLE)) (7b) と、関係RS#0012: (ARTICLE (is-part-of JOURNAL)) (8a) (JOURNAL (has-part-of ARTICLE)) (8b) が定義されている必要がある。すなわち、「記事の主題
には何でも成り得ること」、「記事は雑誌の一部である
こと(記事は雑誌の一部に掲載されるものであるこ
と)」が知識として記憶されている必要がある。(ARTICLE (subject-is SUPERCOMPUTER)) (5) (ARTICLE (is part-of ElectronicsWeek)) (6) In the natural language understanding method according to the present invention, based on the knowledge shown in FIG. Interpret the meaning as follows. First,
The knowledge that enables this inference is, as a general relation,
Relationship RS # 0011: (ARTICLE (subject-is UNIVERSAL)) (7a) (UNIVERSAL (is subject-of ARTICLE)) (7b) and Relationship RS # 0012: (ARTICLE (is-part-of JOURNAL)) (8a) ) (JOURNAL (has-part-of ARTICLE)) (8b) must be defined. In other words, it is necessary to memorize that "the subject of the article can be anything" and "the article is part of a magazine (the article is published in a part of the magazine)". is there.
【0032】また、包摂関係としては、 (SUPERCOMPUTER (is-a THING)) (9) (THING (is-a UNIVERSAL)) (10) (ElectronicsWeek (is-a JOURNAL)) (11) が記憶されている必要がある。As the inclusive relation, (SUPERCOMPUTER (is-a THING)) (9) (THING (is-a UNIVERSAL)) (10) (ElectronicsWeek (is-a JOURNAL)) (11) is stored. Need to be.
【0033】これにより、"supercomputer article" を
解釈することが出来る。まず、SUPERCOMPUTERから包摂
関係を上位に辿って、 (SUPERCOMPUTER (is-a UNIVERSAL)) (UNIVERSAL (is-subject-of ARTICLE)) であることが分かる。その結果、属性継承により、 (SUPERCOMPUTER (is-subject-of ARTICLE)) 或いは、 (ARTICLE (subject-is SUPERCOMPUTER)) という関係が有り得ることが推論される。すなわち、
「スーパーコンピュータは記事の主題に成り得ること」
が選出される。この場合は、これ以外の解釈は無いの
で、解釈: "article whose subject is supercomputer" 「スーパーコンピュータと主題とする記事」 が採用される。Thus, the "supercomputer article" can be interpreted. First, from SUPERCOMPUTER, tracing the subsumption relation to the higher rank, it can be seen that (SUPERCOMPUTER (is-a UNIVERSAL)) (UNIVERSAL (is-subject-of ARTICLE)). As a result, it is inferred that the relationship of (SUPERCOMPUTER (is-subject-of ARTICLE)) or (ARTICLE (subject-is SUPERCOMPUTER)) may exist due to attribute inheritance. That is,
"Supercomputers can be the subject of articles"
Is elected. In this case, there is no other interpretation, so the interpretation: "article whose subject is supercomputer" is adopted.
【0034】複合名詞句(2)の意味解釈は少し複雑で
ある。この場合、図7から分かるように、 (ElectonicsWeek (is-a JOURNAL)) (JOURNAL (has-part-of ARTICLE)) であると同時に、 (ElectronicsWeek (is-a UNIVERSAL)) (UNIVERSAL (is-subject-of ARTICLE)) であるので、 (ElectronicsWeek (has−par
t−of ARTICLE)) と、 (ElectronicsWeek (is−subj
ect−of ARTICLE)) の二つの関係が有り得ることが推論される。すなわち、 "article which is part of ElectronicsWeek" と "article whose subject is ElectronicsWeek" の二つの解釈が有る得ることが分かる。The meaning interpretation of the compound noun phrase (2) is a little complicated. In this case, as can be seen from FIG. 7, (ElectonicsWeek (is-a JOURNAL)) (JOURNAL (has-part-of ARTICLE)) and (ElectronicsWeek (is-a UNIVERSAL)) (UNIVERSAL (is-subject -of ARTICLE)), so (Electronics Week (has-par
(t-of ARTICLE)) and (Electronics Week (is-subj)
ect-of ARTICLE)). That is, it can be understood that there are two interpretations of "article which is part of ElectronicsWeek" and "article whose subject is ElectronicsWeek".
【0035】このように複数の解釈の候補が存在する場
合は、本発明方式では、どの解釈が数多くの具体的事例
を持つかで、解釈の尤もらしさを評価するという発見的
手法を用いる。When a plurality of interpretation candidates are present, the present invention uses a heuristic technique of evaluating the likelihood of interpretation based on which interpretation has many specific cases.
【0036】具体的には、先の例では、概念 "ARTICLE"
と概念 "ElectronicsWeek" の自分も含めた下位の概念
を探索して、関係RS#0011と関係RS#0012
の具体関係が、それぞれ幾つ登録されているかを計数す
る。図7の例では、前者は0、後者は一つ具体関係が登
録されている。すなわち、 "ElectronicsWeek" を主題
とした記事はないが、 "ElectronicsWeek" に掲載され
ている記事は一件、ARTICLE#0101がある。従って、関係
RS#0012(is-part-of)がより適切な解釈として
選択される。すなわち、"article which is part of El
ectronicsWeek" と解釈される。□以上に説明したよう
に、複合名詞句の解釈では、2語の名詞間の関係の推論
処理が基本となる。すなわち、以下説明する三つ以上の
単語から成る複合名詞句の解釈の基本処理は、上記2語
間の関係抽出である。以下、複合名詞句(3)を例に取
って説明する。Specifically, in the above example, the concept "ARTICLE"
And the subordinate concepts of "ElectronicsWeek", including myself, are searched for the relation RS # 0011 and the relation RS # 0012.
And how many specific relationships are registered. In the example of FIG. 7, 0 is registered for the former and one specific relationship is registered for the latter. That is, there is no article on "ElectronicsWeek", but there is one article on "ElectronicsWeek", ARTICLE # 0101. Therefore, the relation RS # 0012 (is-part-of) is selected as a more appropriate interpretation. That is, "article which is part of El
ectronicsWeek ". As described above, the interpretation of compound noun phrases is based on the inference process of the relationship between two nouns. That is, a compound consisting of three or more words described below. The basic processing of the interpretation of the noun phrase is the extraction of the relationship between the two words, and the following description will be made using the compound noun phrase (3) as an example.
【0037】まず、複合名詞句を構成する単語の中に複
合語から成る概念名称があるかどうかを調べながら、各
単語に対応する概念を選び出す。すなわち、先頭から順
次単語を切り取って、概念名称テーブルを参照して、登
録されているかどうかを調べる。First, a concept corresponding to each word is selected while checking whether or not a word constituting the compound noun phrase includes a concept name composed of a compound word. That is, words are sequentially cut from the beginning, and it is checked whether or not the words are registered by referring to the concept name table.
【0038】複合名詞句(3)の場合は、 のように、複合名詞句から部分単語列を切り出して、そ
れぞれが概念名称であるかどうかを調べて行く。In the case of compound noun phrase (3), Then, a partial word string is cut out from the compound noun phrase, and it is checked whether each is a concept name.
【0039】ここで、本方式では、形容詞は対応する名
詞形を名称とする概念の同義語として登録されており、
形容詞は同概念として扱われる点が一つの特徴である。
例えば、形容詞 "Japanese" は概念 "JAPAN"(日本
国)、或いは概念 "Japanese people"(日本人)の同義
語として登録されていて、同概念として扱われる。Here, in this method, adjectives are registered as synonyms of a concept whose name is the corresponding noun form.
One feature of adjectives is that they are treated as the same concept.
For example, the adjective "Japanese" is registered as a synonym for the concept "JAPAN" (Japan) or the concept "Japanese people" (Japanese) and is treated as the same concept.
【0040】従って、この処理の結果、"personal comp
uter" が一つの概念名称、"PERSONAL-COMPUTER" として
定義されていたとすると、複合名詞句(3)はまず、 (JAPAN PERSONAL-COMPUTER COMPANY) (JAPANESE-PEOPLE PERSONAL-COMPUTER COMPANY) として認知される。但し、以下の説明では、判り易くす
るため、最終的には意味のない解釈であることが分かる
後者は省いて説明する。Therefore, as a result of this processing, "personal comp
If "uter" is defined as one concept name, "PERSONAL-COMPUTER", the compound noun phrase (3) is first recognized as (JAPANESE-PEOPLE PERSONAL-COMPUTER COMPANY). However, in the following description, for the sake of simplicity, the latter that is understood to be a meaningless interpretation is omitted.
【0041】すなわち、この段階で、同複合名詞句は実
質的に三つの概念の組合せであることが分かったことに
なる。これは括弧( )を用いて次のようにも表現でき
る。That is, at this stage, it has been found that the compound noun phrase is substantially a combination of three concepts. This can be expressed as follows using parentheses ().
【0042】 (Japanese (personal computer) company) (12) 従って、次の処理は、これら3つの概念がどのように相
互に関連付けられているかを調べることである。この場
合、次の二つの可能性があることが分かる。(Japanese (personal computer) company) (12) Therefore, the next processing is to examine how these three concepts are related to each other. In this case, it can be seen that there are two possibilities.
【0043】 (Japanese ((personal computer) company)) (13) ((Japanese (personal computer))company) (14) まず、(13)の場合、COMPANYとPERSONAL-COMPUTER、およ
びCOMPANYとJAPANの間に結ばれ得る二つの関係を推論す
る必要がある。この場合、先に説明した関係の推論方式
により、 (COMPANY (produces PERSONAL-COMPUTER) (is-located-in JAPAN)) (15a) (COMPANY (has-developed PERSONAL-COMUTER) (is-located-in JAPAN) (15b) なる関係が抽出される。ここでは、複数の解釈の優先度
(尤度:尤もらしさ)を評価するために、COMPANYとPER
SONAL-COMPUTER、およびCOMPANYとJAPANの二つの関係の
具体例(下位の概念に定義されている具体関係)の総数
を、それぞれの解釈(15a)、(15b)に対して計数し、これ
を関係の重みとする。全体の評価としては、具体関係の
総数(関係の重み)を一般関係の数で割って、正規化す
る。(15a)、(15b)の例では、一般関係の数は2である。(Japanese ((personal computer) company)) (13) ((Japanese (personal computer)) company) (14) First, in the case of (13), between COMPANY and PERSONAL-COMPUTER, and between COMPANY and JAPAN We need to infer two relationships that can be connected. In this case, according to the relation inference method described above, (COMPANY (produces PERSONAL-COMPUTER) (is-located-in JAPAN)) (15a) (COMPANY (has-developed PERSONAL-COMUTER) (is-located-in JAPAN ) (15b) is extracted, where COMPANY and PER are used to evaluate the priority (likelihood: likelihood) of multiple interpretations.
The total number of SONAL-COMPUTER and the concrete examples of the two relations of COMPANY and JAPAN (concrete relations defined in the lower concepts) are counted for each interpretation (15a) and (15b), and this is counted. Weight. As the overall evaluation, the total number of specific relations (the weight of relations) is divided by the number of general relations to normalize. In the examples of (15a) and (15b), the number of general relations is two.
【0044】次に、第二の可能性である(14)について関
数を抽出する。この場合、COMPANYとPERSONAL-CPMPUTE
R、およびPERSONAL-COMPUTERとJAPANの二つの関係を求
める必要がある。前者については、 (COMPANY (produces PERSONAL-COMPUTER)) (16a) (COMPANY (has-developed PERSONAL-COMPUTER)) (16b) のような、二つの関係が(想定する知識ベースにおい
て)見つかる。同様に、後者については、 (PERSONAL-COMPUTER (is-produced-by (COMPANY (is Located-in JAPAN))) (17a) (PERSONAL-COMPUTER (was-developed-by (COMPANY (is-located-in JAPAN))) (17b) が見つかる。伺し、ここで、PERSONAL-COMPUTERとJAPAN
とを直接結ぶ関係は無いので、これらを間接的に関係付
ける概念COMPANYを自動的に見出している。Next, a function is extracted for the second possibility (14). In this case, COMPANY and PERSONAL-CPMPUTE
It is necessary to find R and two relations of PERSONAL-COMPUTER and JAPAN. For the former, two relationships are found (in the assumed knowledge base), such as (COMPANY (produces PERSONAL-COMPUTER)) (16a) and (COMPANY (has-developed PERSONAL-COMPUTER)) (16b). Similarly, for the latter, (PERSONAL-COMPUTER (is-produced-by (COMPANY (is Located-in JAPAN)))) (17a) (PERSONAL-COMPUTER (was-developed-by (COMPANY (is-located-in JAPAN) ))) (17b) is found, here, PERSONAL-COMPUTER and JAPAN
Since there is no relation directly connecting with, the concept COMPANY which relates these indirectly is automatically found.
【0045】本発明方式は、このように直接結び付ける
関係が見つからないときは、関係を見出すべきこれら二
つの概念の上位を各々遡って、それら上位概念に定義さ
れる全ての一般関係(の集合)を抽出する。二つの概念
について行うので、二つの一般関係の集合が得られるこ
とになる。これは三つのテーブル231、241、25
1を検索することによって抽出できる。次に、抽出され
た一般関係の相手方に結ばれている概念をそれぞれリス
トアップする。これにより、二つの概念集合が得られる
が、これらの積集合を求めることにより、最終的に二つ
の概念を仲介する概念、先の例では概念COMPANYが得ら
れる。In the method of the present invention, when a relation to directly connect cannot be found in this way, the general concept (set) of all the general relations defined in those higher concepts is traced back to each of these two concepts for which the relationship should be found. Is extracted. Since we are working on two concepts, we have two sets of general relations. This is the three tables 231, 241, 25
1 can be extracted by searching. Next, the concepts connected to the extracted general relationship are listed. As a result, two sets of concepts are obtained. By calculating the intersection of these sets, a concept that mediates the two concepts, that is, the concept COMPANY in the above example, is finally obtained.
【0046】結局、意味の無い組合せを捨てて、以下の
二つの解釈を得る。After all, the meaningless combinations are discarded, and the following two interpretations are obtained.
【0047】 (COMPANY (produces (PERSONAL-COMPUTER (was-developed-by (COMPANY (is-located-in JAPAN)))))) (18a) (COMPANY (has-developed (PERSONAL-COMPUTER (is-produced-by (COMPANY (is-located-in JAPAN)))))) (18b) 最終的には、以下の合計4つの解釈が自動的に得られる
ことになる。(COMPANY (produces (PERSONAL-COMPUTER (was-developed-by (COMPANY (is-located-in JAPAN)))))))) (18a) (COMPANY (has-developed (PERSONAL-COMPUTER (is-produced- by (COMPANY (is-located-in JAPAN)))))) (18b) Ultimately, the following four interpretations will be automatically obtained.
【0048】 "company which produces personal computer which is located in Japan" (19a) "company which has developed personal computer which is located in Japan" (19b) "company which produces personal computer which was developed by company which is located in Japan" (19c) "company which has developed personal computer which is produced by company" (19d) なお、上記の英語の表現において、関係代名詞の掛り受
け関係はインデンテーションによって示した。レベルが
深くなっている場合は、直上の行の名詞を修飾してい
る。"Company which produces personal computer which is located in Japan" (19a) "company which has developed personal computer which is located in Japan" (19b) "company which produces personal computer which was developed by company which is located in Japan "(19c)" company which has developed personal computer which is produced by company "(19d) In the above-mentioned English expression, the relationship of the relation pronoun is indicated by indentation. If the level is deeper, it modifies the noun in the line immediately above.
【0049】複合名詞句(4)についても同様に処理さ
れる。各単語を概念名称とマッチングすることにより、 (USA PERSONAL-COMPUTER SOFTWARE-PACKAGE) のような三つの概念から成ることが、まず分かる。これ
ら概念間の関係を推論することにより、以下の解釈が得
られる。The same applies to the compound noun phrase (4). By matching each word to the concept name, you can first see that it consists of three concepts, such as (USA PERSONAL-COMPUTER SOFTWARE-PACKAGE). By inferring the relationship between these concepts, the following interpretation is obtained.
【0050】 "software package which runs on personal computer which was developed by company which is located in USA" (20) さて、本発明による自然言語理解方式は、複合名詞句の
意味解釈機能の上に、文解釈部(構文解析部)を置くこ
とにより、より強力な名詞句解釈機能を可能とすると同
時に、知識ベースとの自然言語による広範な対話を実現
している。同文解釈部は構文規則を用いるが、リスト1
は同構文規則の一例を示す。一つの構文規則は、非終端
記号(ノンターミナルシンボル;ここでは、鉤括弧<>
で囲んだ記号)で構成される左辺と、その展開形である
右辺、およびその展開が成功したときに評価されるべき
関数の三つの部分から成る(例えば、(21a)式)。伺
し、リスト1では解析が成功したときの評価関数は省略
して示している。各規則の右辺は、終端記号(ターミナ
ルシンボル)と非終端記号から成る列で構成される。こ
こで、記号 "|" は並置を示す。また、非終端記号 <s>
は文章全体を表わす。"Software package which runs on personal computer which was developed by company which is located in USA" (20) The natural language comprehension system according to the present invention has (Syntactic analysis unit) enables a more powerful noun phrase interpretation function and at the same time realizes extensive dialogue with the knowledge base in natural language. The sentence interpreter uses the syntax rules, but Listing 1
Indicates an example of the syntax rule. One syntax rule is that non-terminal symbols (non-terminal symbols;
), And the right-hand side, which is its expanded form, and three parts of the function to be evaluated when the expansion is successful (eg, equation (21a)). In the list 1, the evaluation function when the analysis is successful is omitted. The right side of each rule is composed of a sequence of terminal symbols (terminal symbols) and non-terminal symbols. Here, the symbol "|" indicates juxtaposition. Also, the non-terminal symbol <s>
Represents the whole sentence.
【0051】 −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−− リスト1: <s> :;= <system-command> | (21a) <define-command> | (21b) <search-command> | (21c) <browse-command> (21d) <system-command> ;:= load from <?> | save to <?> | update | quit | stop | <show-word> chart | edit <?> <show-word> ;:= show | print <search-command> ;:= <find-word><noun-phrase> (22) <find-word> ;:= look up | look for | search for | lookup | find (23) <noun-phrase> ;:= <noun-group> | (24a) <noun-phrase><joiner><noun-phrase> (24b) <noun-group> ;:= <noun-compound> | (25a) <art><noun-compound> | (25b) <def-art><noun-compound> (25c) <noun-compound> ;:= <noun-string> (26) <noun-string> ;:= <concept> | (27a) <concept><noun-string> (27b) <joiner> ;:= <prep> | <rel-pronoun><link> (28) <define-command> ;:= define relation <new-phrase> . | (29a) define <?> as <noun-phrase> . | (29b) <noun-phrase> is <noun-phrase> . | (29c) <noun-phrase><link><noun-phrase> . | (29d) <noun-group> is also known as <?> . (29e) <new-phrase> ;:= <noun-compound><?><noun-compound> (30) <?> ;:= <null> | <null><?> (31) −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−− 文解釈部はボトムアップ処理による語彙解析部と、トッ
プダウン処理による構文解析部とから成る。本方式にお
ける構文解析部は、構文規則に合致する全ての文構造を
候補として出力する。そこから、意味のある解釈(単語
間の掛り受け関係)のみを先に説明した複合名詞句解析
により評価、選択する。−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−− List 1: <s>:; = (21a) <define-command> | (21b) <search-command> | (21c) <browse-command> (21d) <system-command>;: = load from <?> | save to <? update | quit | stop | <show-word> chart | edit <?><show-word>;: = show | print <search-command>;: = <find-word><noun-phrase> (22 ) <find-word>;: = look up | look for | search for | lookup | find (23) <noun-phrase>;: = <noun-group> | (24a) <noun-phrase><joiner><noun-phrase> (24b) <noun-group>;: = <noun-compound> | (25a) <art><noun-compound> | (25b) <def-art><noun-compound> (25c) <noun-compound>;: = <noun-string> (26) <noun-string>;: = <concept> | (27a) <concept><noun-string> (27b) <joiner>;: = <prep><rel-pronoun><link> (28) <define-command>;: = define relation <new-phrase>. | (29a) define <?> as <noun-phrase>. | (29b) <noun- phrase> is <noun-phrase>. | (29c) <noun-phrase><link><noun-phras (29d) <noun-group> is also known as <?>. (29e) <new-phrase>;: = <noun-compound><?><noun-compound> (30) <?>;: = <null> | <null><?> (31) −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−− -The sentence interpreter consists of a vocabulary analyzer by bottom-up processing and a parser by top-down processing. The syntax analyzer in this method outputs all sentence structures that match the syntax rules as candidates. From there, only the meaningful interpretation (the interrelation between words) is evaluated and selected by the compound noun phrase analysis described above.
【0052】ボトムアップ処理である語彙解析(lexica
l analysis)は、概念名称、関係記述子、前置詞、関係
代名詞、冠詞の区別が記述されている語彙辞書(lexico
n)を用いて行われる。Lexical analysis (lexica) which is a bottom-up process
l analysis) is a lexical dictionary (lexico) that describes concept names, relational descriptors, prepositions, relational pronouns, and articles.
n).
【0053】同語彙辞書は、先に説明した知識表現方式
による概念ネットワークから編集処理により自動的に構
築することが可能である。具体的には、概念名称はテー
ブル221(図3)から抽出される。語彙解析の結果、
概念名称とマッチングした入力文中の単語は、<concept
> という非終端記号として認識される。The vocabulary dictionary can be automatically constructed by editing processing from the concept network based on the knowledge expression method described above. Specifically, the concept names are extracted from the table 221 (FIG. 3). As a result of lexical analysis,
Words in the input sentence that match the concept name are <concept
Recognized as the nonterminal symbol>.
【0054】関係記述子とは、同知識表現方式における
「関係」、または、その「読み」のことであり、例え
ば、"is author of","wrote","has written","autho
r is"などである。これらは、一般関係定義テーブル2
41(図5)から抽出される。これらにマッチングした
入力文中の単語、または単語列は非終端記号 <link> と
して認織される。The relation descriptor is a “relation” or “reading” thereof in the same knowledge expression method. For example, “is author of”, “wrote”, “has written”, “autho”
ris "etc. These are the general relationship definition table 2
41 (FIG. 5). Words or word strings in the input sentence that match these are recognized as non-terminal <link>.
【0055】前置詞は"by","from","of"などであり、
その意味(それが表わす関係の種類)は一般関係定義テ
ーブル241(図5)から自動的に抽出される。これら
前置詞は非終端記号 <prep> として認識される。ここ
で、関係記述子および前置詞として認織された場合に
は、上記非終端記号とともに、それらが意味する「関
係」の種類とその方向を語彙解析結果として出力する。
これにより、後述するように、"book by Newton"のよう
な名詞句の意味解釈が可能となる(構文規則(24b),
(28)を参照)。Prepositions are "by", "from", "of", etc.
Its meaning (the type of relation it represents) is automatically extracted from the general relation definition table 241 (FIG. 5). These prepositions are recognized as non-terminal <prep> symbols. Here, in the case of being recognized as a relation descriptor and a preposition, the type of the "relation" and the direction of the non-terminal symbol are output as a lexical analysis result together with the non-terminal symbol.
This makes it possible to interpret the meaning of a noun phrase such as "book by Newton", as described later (syntax rules (24b),
(See (28)).
【0056】同語彙辞書には、更に、関係代名詞 <rel
- pronoun> (which, who, that)、不定冠詞 <art> (a,
an)、定冠詞 <def-art> (the) が記憶されている。ま
た、語彙解析で認識できなかった単語は非終端記号 <nu
ll> として認識される。The vocabulary dictionary further includes a relational pronoun <rel
-pronoun> (which, who, that), indefinite article <art> (a,
an) and the definite article <def-art> (the). Words that could not be recognized by lexical analysis are non-terminal symbols <nu
ll>
【0057】構文解析は、このボトムアップ前処理とし
ての語彙解析をもとに行われる。図8を用いて構文解析
方法を説明する。同図において、入力文として、三つの
単語401、402、403が解析される。上部から下
部へ流れる矢印(例えば、矢印411)はボトムアップ
処理を、下部から上部へ流れる矢印(例えば、矢印41
2)はトップダウン処理を表わす。The syntax analysis is performed based on the vocabulary analysis as the bottom-up preprocessing. The syntax analysis method will be described with reference to FIG. In the figure, three words 401, 402, and 403 are analyzed as input sentences. The arrow flowing from the upper part to the lower part (for example, the arrow 411) indicates the bottom-up processing, and the arrow flowing from the lower part to the upper part (for example, the arrow 41).
2) represents a top-down process.
【0058】語彙解析の結果として、単語401(pers
onal)にはマッチングする概念がないこと、単語402
(computer)の解釈としては二つの概念「計算機」およ
び「雑誌コンピュータ」が有り得ること、単語列401
−402(personal computer)は概念「パーソナルコ
ンピュータ」にマッチングすること、単語403(comp
any)は概念「会社」にマッチングすることが出力され
る。As a result of the lexical analysis, the word 401 (pers
onal) has no matching concept, word 402
The interpretation of (computer) is that there can be two concepts, “computer” and “magazine computer”, word string 401
-402 (personal computer) matches the concept "personal computer", word 403 (comp
any) is output to match the concept "company".
【0059】構文解析部は、これらの結果を受けて、例
えばリスト1に示す構文規則を参照して、文全体を展開
していく。図8は、その途中からのみを示しているが、
同図において、<noun-phrase> 421は(25a)式によ
り <noun-compound> 422へ、更に、(26)式により <
noun-string> 423へ展開される。更に、<noun-strin
g> は(27b)式により <concept> 426と <noun-stri
g> 427とに展開される。後者の <noun-string> は(2
7a)式により <concept> 428に展開される。結局、図
8の例では、入力文(名詞句)の解釈は、(personal c
omputer)と(company)の二つの概念(<concept>)と
から構成される複合名詞句(noun compound)が有り得
ることが分かる。The syntax analyzer receives these results, and expands the entire sentence with reference to, for example, the syntax rules shown in Listing 1. FIG. 8 shows only from the middle,
In the figure, <noun-phrase> 421 is converted to <noun-compound> 422 according to equation (25a), and <noun-phrase> 421 according to equation (26).
noun-string> Expands to 423. Furthermore, <noun-strin
g> is expressed by <concept> 426 and <noun-stri
g> 427. The latter <noun-string> is (2
It is expanded to <concept> 428 by the expression 7a). After all, in the example of FIG. 8, the interpretation of the input sentence (noun phrase) is (personal c
It can be seen that there can be a compound noun phrase (noun compound) composed of two concepts (<concept>) of (omputer) and (company).
【0060】なお、ここで図8以降図11まででは、図
面を簡単にするために、リスト1で示す記号は、次のよ
うに簡略化している。すなわち、<noun-phrase>, <noun
-group>, <noun-compound>, <noun-string>, <joiner>,
<rel-pronoun>, <find-word> は、それぞれ <n-phrase
>, <n-group>, <n-comp>, <n-string>, <join>, <rpron
>, <find> と表記している。Here, in FIGS. 8 to 11, the symbols shown in List 1 are simplified as follows in order to simplify the drawings. That is, <noun-phrase>, <noun
-group>, <noun-compound>, <noun-string>, <joiner>,
<rel-pronoun> and <find-word> are <n-phrase
>, <n-group>, <n-comp>, <n-string>, <join>, <rpron
>, <find>.
【0061】本構文解析では、構文的に可能な文構造を
全て抽出する。そのような構文解析アルゴリズムとして
は、例えばチャートバーザ[文献:エイチ・トンプソ
ン、エトアル、"インプリメンティング" ナチュラル・
ラングエッジ・バーザーズ"、アーティフィシャル・イ
ンテリジェンス:トゥール、テクニーク、アンド アプ
リケーションズ、エディティッド バイ テー・オシア
アンド エム・アイゼンシュタト、ハーパ・アンド・
ロー、ニューヨーク、1984、ピーピー、245−3
00:Thompson, H. et al., "Implementing Natural L
anguage Parsers, "in Artificial Intelligence: Tool
s, Techniques, and Applications, editedby T. O'She
a and M. Eisenstat, Harper and Row, New York, NY,
1984, pp.245-300]が知られている。In this syntactic analysis, all syntactically possible sentence structures are extracted. Examples of such parsing algorithms include, for example, Chart Barza [Reference: H. Thompson, Etoal, "Implementing" Natural
Langedge Barthers ", Artificial Intelligence: Tours, Technique, And Applications, Edited By The Ossia And M Eisenstadt, Harpa And And
Rho, New York, 1984, PP, 245-3
00: Thompson, H. et al., "Implementing Natural L
anguage Parsers, "in Artificial Intelligence: Tool
s, Techniques, and Applications, editedby T. O'She
a and M. Eisenstat, Harper and Row, New York, NY,
1984, pp.245-300] is known.
【0062】抽出された全構文候補は、各々構文規則に
記されている評価式により評価される。本発明の特徴
は、この評価に知識ベースに記憶されている知識を用い
る点にある。図8の例の場合では、概念 "personal com
puter" と概念 "company" から意味のある複合名詞句が
構成され得るかを評価する。この評価方法は、先に説明
した概念ネットワークに登録されている知識を用いる方
式を用いる。この結果、意味のある構文解析結果が尤度
の順に得られることになる。All the extracted syntax candidates are evaluated by the evaluation formulas described in the syntax rules. A feature of the present invention is that knowledge stored in a knowledge base is used for this evaluation. In the example of FIG. 8, the concept "personal com
puter "and the concept" company "to form a meaningful compound noun phrase. This evaluation method uses the knowledge registered in the concept network described above. Will be obtained in the order of likelihood.
【0063】図9以降は検索文全体に対する構文解析結
果を示す。検索文は、構文規則(21c),(22)を用い
て、命令語と名詞句とに展開される。図9は、図8の名
詞句を含む例である。図10は、関係代名詞を含む名詞
句を含む検索文の分析の例である。ここでは、図5で示
した概念関係モデルの「関係」の「読み」が関係代名詞
句の述語として機能しているのが分かる。更に、図11
は、前置詞を含む検索文の例である。ここで、前置詞o
nは関係「主題」("whose subject is")を、前置詞a
tは関係「所属」("who works at")を意味しているこ
とが、既に説明したように、図5で示した一般関係定義
テーブルに記されている。FIG. 9 and subsequent figures show the results of parsing the entire search sentence. The search sentence is expanded into a command word and a noun phrase using the syntax rules (21c) and (22). FIG. 9 is an example including the noun phrase of FIG. FIG. 10 is an example of analysis of a search sentence including a noun phrase including a relative pronoun. Here, it can be seen that “reading” of “relation” in the conceptual relation model shown in FIG. 5 functions as a predicate of the relation pronoun phrase. Further, FIG.
Is an example of a search sentence including a preposition. Where the preposition o
n is the relation "subject"("whose subject is") and the preposition a
The fact that t means the "affiliation"("who works at") is described in the general relationship definition table shown in FIG. 5, as already described.
【0064】以上、説明した原理により、知識ベースと
最小限の構文規則により、陽に関係が記述されていない
名詞の列(複合名詞句)を含む自然言語文を意味解析す
ることが可能である。According to the principle described above, it is possible to semantically analyze a natural language sentence including a sequence of nouns (compound noun phrases) for which no relation is explicitly described, using a knowledge base and minimal syntax rules. .
【0065】[0065]
(実施例1)以下、本発明の一実施例を説明する。図1
4は、本発明の一実施例である知識ベースシステムのハ
ードウェア構成のブロック図である。(Embodiment 1) An embodiment of the present invention will be described below. FIG.
FIG. 4 is a block diagram of a hardware configuration of a knowledge base system according to one embodiment of the present invention.
【0066】同システムは、同図において、主に中央制
御装置(CPU)101、主メモリユニット(MMU)
102、ワークメモリユニット(WMU)103、シス
テムファイルとユーザファイルとを持つ統合ディスクユ
ニット121、122、プリンタ131、ローカル・エ
リア・ネットワーク(LAN)に接続するための通信制
御装置(CCU)141およびユーザとの対話のための
表示装置(CRT)151、キーボード152、マウス
153から成る。The system is mainly composed of a central control unit (CPU) 101 and a main memory unit (MMU) in FIG.
102, a work memory unit (WMU) 103, integrated disk units 121 and 122 having system files and user files, a printer 131, a communication control unit (CCU) 141 for connecting to a local area network (LAN), and a user A display device (CRT) 151, a keyboard 152, and a mouse 153 for dialogue with the user.
【0067】統合ディスクユニットは磁気ディスクと光
ディスクとから成り、例えば本実施例の場合は、第1の
ディスクユニット(DKU1)121は磁気ディスクで
構成されていて、高速性が要求される情報を記憶する。
一方、第2のディスクユニット(DKU2)122は光
ディスクで構成され、特に大容量の情報を記憶する。The integrated disk unit is composed of a magnetic disk and an optical disk. For example, in the case of this embodiment, the first disk unit (DKU1) 121 is composed of a magnetic disk and stores information requiring high speed. I do.
On the other hand, the second disk unit (DKU2) 122 is made up of an optical disk, and particularly stores a large amount of information.
【0068】システムファイルには、オペレーティング
システム、通信管理プログラム、ファイル管理プログラ
ム、知識ベース管理プログラム、或いは統合オフィス業
務支援システムといったシステムが提供するプログラム
群、およびそれに必要なデータベースなどのファイル群
が格納されている。一方、ユーザファイルには、個人化
されたシステム提供のプログラムやユーザが作成したプ
ログラムなどのアプリケーションプログラム群と、それ
に必要なデータベースなどのファイル群、およびユーザ
などが作成した統合知識ベース(後述)が格納されてい
る。The system file stores a group of programs provided by a system such as an operating system, a communication management program, a file management program, a knowledge base management program, or an integrated office operation support system, and a group of files such as a database required for the system. ing. On the other hand, a user file includes a group of application programs such as a personalized system-provided program and a program created by a user, a group of files such as a database required for the program, and an integrated knowledge base (described later) created by a user and the like. Is stored.
【0069】システムの動作は、主メモリユニットにロ
ードされたプログラムの制御に従って、必要なデータを
主メモリユニットおよびファイルにアクセスして行われ
る。同時に、ユーザは表示装置151に表示される情報
を見ながら、入力手段152、153を用いてシステム
と対話することが可能である。The operation of the system is performed by accessing necessary data to the main memory unit and the file under the control of the program loaded in the main memory unit. At the same time, the user can interact with the system using the input means 152 and 153 while viewing the information displayed on the display device 151.
【0070】本発明の知識ベースシステムのソフトウェ
ア部分は、概念ネットワークエディタ、概念ネットワー
クブラウザ、自然言語文解釈プログラム、マルチメディ
アファイル管理プログラムとから成るプログラム群と、
それらが用いる情報を統合した統合知識ベースとから成
る。以下、それぞれについて順次説明する。The software part of the knowledge base system according to the present invention includes a program group consisting of a concept network editor, a concept network browser, a natural language sentence interpretation program, and a multimedia file management program;
It consists of an integrated knowledge base integrating the information used by them. Hereinafter, each of them will be sequentially described.
【0071】まず、概念ネットワークエディタは、既に
説明した概念関係モデルに基づいて、オブジェクト指向
の知識ベースの編集、検索、管理を行う。知識・情報
は、図3から図6までに示した概念名称テーブル、包摂
関係テーブル、一般関係定義テーブル、および関係テー
ブルによって記憶、管理する。これらに記憶されている
データを、ここでは概念ネットワークという。First, the concept network editor edits, searches, and manages an object-oriented knowledge base based on the concept relation model described above. The knowledge and information are stored and managed by the concept name table, the inclusion relation table, the general relation definition table, and the relation table shown in FIGS. The data stored in these is called a concept network here.
【0072】概念ネットワークエディタは、所定の仕様
に基づくコマンド言語(形式言語)によって、以下の機
能を提供する。The concept network editor provides the following functions using a command language (formal language) based on a predetermined specification.
【0073】(1)概念の登録:概念名称と分類階層位
置を指定して、新概念を登録。(1) Concept registration: A new concept is registered by designating a concept name and a classification hierarchy position.
【0074】(2)一般関係の登録:二つの概念と関係
の言語的表現法を指定して、新しい関係の種類を登録。(2) Registration of general relation: A new relation type is registered by designating two concepts and a linguistic expression of the relation.
【0075】(3)具体関係の登録:二つの概念と関係
の種類を指定して、事実、関係、属性などを登録。(3) Registration of concrete relation: Facts, relations, attributes, etc. are registered by designating two concepts and the kind of relation.
【0076】(4)概念名称の編集:名称の修正;同義
語・別名の削除・追加。(4) Editing a concept name: correcting the name; deleting / adding synonyms / aliases.
【0077】(5)一般関係の編集:関係付けられてい
る二つの概念の変更;言語的表現法の修正と追加。(5) Editing of general relations: change of two related concepts; modification and addition of linguistic expressions.
【0078】(6)概念の削除 (7)具体関係の削除 (8)階層分類体系の変更 (9)上位概念の追加:二重(或いはそれ以上)に同一
概念を分類;属性等の多重継承の付与。(6) Deletion of concepts (7) Deletion of concrete relations (8) Change of hierarchical classification system (9) Addition of superordinate concept: Classify the same concept doubly (or more); Multiple inheritance of attributes, etc. Grant.
【0079】(10)構造化概念の登録・削除:概念を概
念によって修飾した抽象的概念(後述)の登録および削
除。(10) Registration / deletion of a structured concept: Registration and deletion of an abstract concept (described later) in which the concept is modified by the concept.
【0080】(11)語彙辞書の更新:概念ネットワーク
から語彙解析に必要な情報を語彙辞書に追加・編集。□ (12)概念の検索:部分文字列、キーワード、構造化概
念からの検索。(11) Update of vocabulary dictionary: Information necessary for vocabulary analysis is added / edited from the concept network to the vocabulary dictionary. □ (12) Search for concepts: Search from substrings, keywords, and structured concepts.
【0081】(13)ネットワーク跋渉:分類階層木、お
よび連想による注目概念の移動。(13) Network traversal : movement of a concept of interest by a classification hierarchical tree and association.
【0082】(14)マルチメディア情報の付加・削除:
任意の概念にマルチメディアファイル内の情報を連想的
に付加、或いは削除。(14) Addition / deletion of multimedia information:
Associatively add or delete information in multimedia files to any concept.
【0083】(15)マルチメディア情報の読出し:概念
に付加されているマルチメディア情報のマルチメディア
ファイルからの読出し。(15) Read multimedia information: Read multimedia information added to a concept from a multimedia file.
【0084】ここで、上記機能における構造化概念につ
いて説明する。構造化概念とは、ある概念を別の概念と
関係とによって、修飾した(意味を限定した)抽象的な
概念であり、概念ネットワークとは別の記憶手段に格納
する。具体的には、これまでにも例で示してきた複合名
詞句がそれに当たる。例えば、構造化概念D#0011を として、登録できる。より具体的には、下記の内部デー
タ構造、 のように、固有番号で記憶する。ここで、第1要素は構
造化概念固有番号、第2要素は構造化概念名称、第3要
素は構造化概念定義式である。但し、上記記法の例でC#
0401は概念 "article"、C#0501は概念 "supercompute
r"、RS#0033は関係「主題」(subject)の固有番号であ
る。Here, the structuring concept in the above function will be described. The structured concept is an abstract concept in which a certain concept is modified (limited in meaning) by another concept and a relation, and is stored in a storage unit different from the concept network. Specifically, the compound noun phrase shown in the examples so far corresponds to this. For example, the structured concept D # 0011 You can register as More specifically, the following internal data structure: Is stored as a unique number. Here, the first element is a structured concept unique number, the second element is a structured concept name, and the third element is a structured concept definition formula. However, in the above notation example, C #
0401 is the concept "article", C # 0501 is the concept "supercompute"
r "and RS # 0033 are unique numbers of the relation" subject ".
【0085】この構造化概念は、抽象的な、或いは記述
的な記憶から情報を検索する際に用いる。本システム
は、構造化概念から、推論処理を用いて具体的な概念を
概念ネットワークから検索する機能を有する。上記の例
では、概念 "article" に包摂される具体的概念(概念
"article" の下位概念)の集合の中から、主題が概念"
supercomputer" に包摂される概念であるもののみ抽出
することが可能である。この処理を概念マッチングとい
うが、これは逆向きの推論処理によって実現される。This structured concept is used when retrieving information from abstract or descriptive storage. The present system has a function of searching for a specific concept from a structured network using a reasoning process from a concept network. In the example above, the concrete concept (concept
From the set of "articles", the subject is a concept "
It is possible to extract only those concepts that are subsumed by "supercomputer". This process is called concept matching, which is realized by reverse inference.
【0086】このように、構造化概念を記憶する手段
と、それからの検索手段を与えることによって、ユーザ
は随意に自分のものの見方をシステムに登録し、更に、
欲しい概念を容易に検索することが可能である。As described above, by providing the means for storing the structured concept and the search means therefrom, the user can arbitrarily register his / her own viewpoint in the system, and further,
It is possible to easily search for a desired concept.
【0087】概念ネットワークエディタの機能におい
て、マルチメディア情報機能を更に説明する。マルチメ
ディアファイルには、例えばイメージスキャナによって
入力した写真を登録・蓄積することが出来る。概念ネッ
トワークエディタには、同写真をある概念に連想的に付
加する機能がある。具体的には、概念固有番号とマルチ
メディアファイルメンバ名称との対応表を作成し、管理
することにより実現する。ユーザは同概念を検索した後
で、その写真を表示させることが可能である。マルチメ
ディアファイルには、写真のほかにも、文書イメージ
や、音声情報等を記録することが可能である。In the function of the concept network editor, the multimedia information function will be further described. For example, photos input by an image scanner can be registered and stored in the multimedia file. The concept network editor has the function of associatively adding the photo to a concept. More specifically, this is realized by creating and managing a correspondence table between concept unique numbers and multimedia file member names. After searching for the same concept, the user can display the photograph. In addition to photographs, document images, audio information, and the like can be recorded in the multimedia file.
【0088】本概念ネットワークエディタの構成法とし
ては、発明「情報記憶方式」(特願昭60−6067
8)で開示している方法を用いることが出来るので、こ
こでは説明を省略する。As a method of configuring the concept network editor, the invention “Information storage method” (Japanese Patent Application No. 60-6067)
Since the method disclosed in 8) can be used, the description is omitted here.
【0089】さて、次に概念ネットワークブラウザを説
明する。概念ネットワークブラウザとは、概念ネットワ
ークエディタのためのビジュアルインターフェース(視
覚形インターフェース)であり、マルチウィンドウとマ
ウスを用いた直接操作方式と採用することによって操作
性向上を図っている。同ブラウザは知識ベースの内容を
概念階層木、フレーム形式、或いはテーブル形式、更に
は自然言語形式で、任意のウィンドウ内に表示すること
が出来る。また、その表示上のオブジェクト(概念と関
係)を例えばマウスで直接指示して、更に、メニューの
中から命令を選択指示することにより、先の概念ネット
ワークエディタの任意の機能を呼び出して、実行するこ
とが出来る。概念ネットワークブラウザは、ユーザのこ
のような直接的指示を形式言語であるコマンド言語に翻
訳して概念ネットワークエディタを起動する。Next, the concept network browser will be described. The concept network browser is a visual interface (visual interface) for the concept network editor, and improves operability by adopting a direct operation method using a multi-window and a mouse. The browser can display the contents of the knowledge base in an arbitrary window in a concept hierarchical tree, frame format, table format, or even natural language format. Also, by directly pointing an object (concept and relation) on the display with, for example, a mouse, and further selecting and instructing a command from a menu, an arbitrary function of the above concept network editor is called and executed. I can do it. The concept network browser translates such a user's direct instruction into a command language, which is a formal language, and activates the concept network editor.
【0090】次に、自然言語文解釈プログラムを機能ブ
ロック図、図1を参照しながら説明する。本発明の主な
る特徴の一つは、本自然言語文解釈方式にあり、その原
理については、先に説明した。同自然言語文解釈プログ
ラムは、構成としては、ユーザからの単語列501を入
力するための入力部502、同単語列の各単語の属性を
解析する語彙解析部503、構文規則を記憶した文法フ
ァイル514を参照しながら構文を解析する構文解析部
504、および、複合名詞解析部506とから成ってい
る。動作としては、本自然言語文解釈プログラムは概念
ネットワークブラウザから自然言語文501を受け取
り、解釈結果505を同概念ネットワークブラウザに返
す。Next, a natural language sentence interpretation program will be described with reference to a functional block diagram and FIG. One of the main features of the present invention resides in the present natural language sentence interpretation system, and its principle has been described above. The natural language sentence interpretation program has an input unit 502 for inputting a word string 501 from a user, a vocabulary analysis unit 503 for analyzing attributes of each word of the word string, and a grammar file storing syntax rules. It comprises a syntax analyzer 504 for analyzing the syntax while referring to 514, and a compound noun analyzer 506. The operation, the natural language text interpreter receives a natural language sentence 501 from the concept network browser, returns the interpretation result 505 in the concept network browser.
【0091】本実施例では、語彙解析部は、構造化概念
ファイル511、語彙辞書ファイル512、および概念
ネットワーク形知識ベース513の概念名称テーブル5
22を参照して解析を実行する。ここで、構造化概念フ
ァイル511は、先述したように、構造化概念固有番
号、構造化概念名称、構造化概念定義式の3組の集合を
記憶する。また、語彙辞書512は図12で示す前置詞
テーブル601、および図13で示す関係記述子テーブ
ル611で構成される。別な実施例として、高速化処理
のため、語彙辞書に概念名称テーブルも含める構成も有
り得る。In the present embodiment, the vocabulary analysis unit includes the structured concept file 511, the vocabulary dictionary file 512, and the concept name table 5 of the concept network type knowledge base 513.
The analysis is executed with reference to 22. Here, as described above, the structured concept file 511 stores a set of three sets of a structured concept unique number, a structured concept name, and a structured concept definition expression. The vocabulary dictionary 512 includes a preposition table 601 shown in FIG. 12 and a relation descriptor table 611 shown in FIG. As another embodiment, there may be a configuration in which a concept name table is also included in the vocabulary dictionary for high-speed processing.
【0092】前置詞テーブル601は、各前置詞に対
し、同前置詞が表わす一般関係の固有番号を、同関係の
方向別に記憶する。図12の例でいうと、前置詞at
は、一般関係RS#0123を左から右に読んだ場合
や、RS#0209を右から左に読んだ場合等の「関
係」を表わす。また、関係記述子テーブル611は、各
関係記述子に対し、その一般関係固有番号とその方向性
を記憶する。これらの二つのテーブルは、これまでの説
明から容易に理解できるように、全ての有り得る前置詞
を別途記憶しておくことにより、図5で示した一般概念
定義テーブルから自動的に構築したり、更新したりでき
る。この機能は、図1における語彙辞書編集部507に
より提供され、実際には、概念ネットワークエディタの
機能の一部である。The preposition table 601 stores, for each preposition, a unique number of a general relation represented by the preposition, for each direction of the relation. In the example of FIG. 12, the preposition at
Represents a “relation” such as a case where the general relationship RS # 0123 is read from left to right or a case where RS # 0209 is read from right to left. The relation descriptor table 611 stores, for each relation descriptor, its general relation unique number and its directionality. These two tables are automatically constructed or updated from the general concept definition table shown in FIG. 5 by storing all possible prepositions separately so that they can be easily understood from the above description. You can do it. This function is provided by the vocabulary dictionary editing unit 507 in FIG. 1, and is actually a part of the function of the concept network editor.
【0093】ここで語彙解析部の機能の説明を一部補足
する。発明の原理の説明では、理解を助けるため構造化
概念については述べなかったが、語彙解析部では、構造
化概念名称にマッチングした単語および単語列は、非終
端記号 <concept> として認識すると同時に、構造化概
念の場合には、構造化概念定義式を評価値として出力す
る。Here, the description of the function of the vocabulary analysis unit is partially supplemented. In the explanation of the principle of the invention, the structured concept was not described in order to facilitate understanding.However, the vocabulary analyzer recognizes the word and word string that matched the structured concept name as a non-terminal symbol <concept>, In the case of a structured concept, the structured concept definition expression is output as an evaluation value.
【0094】この目的のため、語彙解析部は、入力単語
列から原理説明のように部分単語列を順次取り出して、
各部分単語列が通常の概念名称のみならず、構造化概念
名称についてもマッチング(一致)するかどうかを調べ
る。その結果、それら何れかにマッチングする場合は、
非終端記号として <concept> を認識結果とし、更に、
通常の概念名称にマッチングした場合は同概念の固有番
号を評価値とし、構造化概念名称にマッチングした場合
は同構造化概念の定義式を評価値とする。For this purpose, the vocabulary analyzer sequentially extracts partial word strings from the input word strings as in the principle explanation,
It is checked whether or not each partial word string matches not only the normal concept name but also the structured concept name. As a result, if any of them match,
<Concept> is a recognition result as a non-terminal symbol.
When matching with a normal concept name, the unique number of the same concept is used as the evaluation value, and when matching with the structured concept name, the definition formula of the same structured concept is used as the evaluation value.
【0095】更に、語彙解析の結果、前置詞および関係
記述子として認識された場合には、それぞれ対応する非
終端記号を認識結果とすると同時に、対応する全ての
「関係」を評価値とする。これら評価値は、認識結果で
ある非終端記号に付随して、語彙解析結果として出力さ
れる。Further, as a result of the vocabulary analysis, when it is recognized as a preposition and a relation descriptor, the corresponding non-terminal symbol is set as a recognition result, and all the corresponding "relations" are set as evaluation values. These evaluation values are output as a vocabulary analysis result accompanying the non-terminal symbol as the recognition result.
【0096】構造解析部504は、原理説明で述べたよ
うに、語彙解析結果を入力として、文法ファイル514
の構文規則を参照しながら可能な全ての文構造をまず生
成する。構文規則に照らして可能な文構造を生成するこ
と(狭義の)のパージングという。このパージング段階
では、意味的な適合性は勘案していない。次に、構文解
析部504は意味的な適合性の分析と、複合名詞句の意
味解析を複合名詞解析部506に行わせる。これによ
り、候補として生成された文構造の集合から、意味的に
適合するものが尤度の順に選択されることになる。As described in the principle explanation, the structure analysis unit 504 receives the lexical analysis result as an input, and
First, generate all possible sentence structures while referring to the syntax rules of. Purging (in a narrow sense) a possible sentence structure according to syntax rules is called parsing. At this purging stage, no semantic relevance was considered. Next, the syntactic analysis unit 504 causes the compound noun analysis unit 506 to perform semantic compatibility analysis and semantic analysis of the compound noun phrase. As a result, semantically compatible sentences are selected in the order of likelihood from the set of sentence structures generated as candidates.
【0097】構文解析の結果として、意味的に特に重要
な要素は名詞句 <noun-phrase> であるので、 主に名詞
句の構文解析について、図9から図11の例を用いてよ
り具体的に説明する。As a result of the parsing, a semantically particularly important element is the noun phrase <noun-phrase>. Therefore, the parsing of the noun phrase will be described in more detail with reference to the examples of FIGS. Will be described.
【0098】まず、図9の場合において、名詞句: "personal computer companies" は、パージングの結果、下記に示す構造として解析され
る。First, in the case of FIG. 9, the noun phrase “personal computer companies” is analyzed as a structure shown below as a result of parsing.
【0099】 (<noun-phrase> D#1009 "personal computer companies" ((<concept> (C#1001 "personal computer")) (<concept> (C#1022 "company")))) (32) ここで、(32)式に於いて、第1要素は非終端記号、
第2要素は随時与えられる構造化概念番号、第3要素は
入力文の対応する単語列、更に、第4要素以降はパージ
ング結果を表わす。パージング結果は、複数の解釈が存
在する場合にそれらを並置する。(32)式では、単一
候補のため第5要素以降は存在しない。また、第4要素
は、一般的に概念と関係とからなる列を構成する。(3
2)式の例では、二つの概念の列になっている。関係を
含んだ例は、後述(35)式で説明する。(<Noun-phrase> D # 1009 "personal computer companies"((<concept> (C # 1001 "personal computer")) (<concept> (C # 1022 "company")))) (32) Here, in the equation (32), the first element is a non-terminal symbol,
The second element indicates a structured concept number given as needed, the third element indicates a corresponding word string of the input sentence, and the fourth and subsequent elements indicate a parsing result. The parsing result juxtaposes multiple interpretations if they exist. In the equation (32), since the candidate is a single candidate, the fifth and subsequent elements do not exist. In addition, the fourth element generally constitutes a sequence composed of concepts and relationships. (3
In the example of the expression 2), there are two concept columns. An example including the relationship will be described later using Expression (35).
【0100】これら概念および関係は、(32)式に示
す如く、その識別子(非終端記号)と具体的にマッチン
グした概念または関係の列でそれぞれ表わされる。(3
2)式の例では、各概念は単一のマッチング結果しかな
い。複数のマッチング結果の例は、(37)式に示す。As shown in equation (32), these concepts and relations are represented by columns of concepts or relations specifically matched with the identifiers (non-terminal symbols). (3
In the example of equation 2), each concept has only a single matching result. An example of a plurality of matching results is shown in Expression (37).
【0101】さて、構文解析部はパージング結果(3
2)式を受けて、同式の最後の2行を複合名詞解析部5
06に送る。同複合名詞解析部は、原理説明で述べた方
法により、二つの概念C#1011とC#1022の意
味的な関係を概念ネットワークで表わす知識ベースから
推論する。その結果、(想定する知識ベースに於いて)
次の二つの解釈、(33)式および(34)式を得る。
この例では、陽に記述されていない関係が推論処理によ
って抽出されている。Now, the parsing unit checks the parsing result (3
2) In response to the expression, the last two lines of the expression are replaced with the compound noun analysis unit 5
Send to 06. The compound noun analysis unit infers the semantic relationship between the two concepts C # 1011 and C # 1022 from a knowledge base represented by a concept network by the method described in the principle explanation. As a result (in the assumed knowledge base)
The following two interpretations, Expressions (33) and (34), are obtained.
In this example, relations not explicitly described are extracted by inference processing.
【0102】 これらは自然言語的に表現すると、それぞれ以下のよう
になる。[0102] These are expressed as follows in natural language.
【0103】 次に、図10の例について示す。この場合、パージング
結果は(35)式のようになる。すなわち、名詞句は二
つの概念が結合子(joiner)によって結び付けられたも
のとして認識される。[0103] Next, an example of FIG. 10 will be described. In this case, the purging result is as shown in equation (35). That is, a noun phrase is recognized as two concepts connected by a joiner.
【0104】 (<noun-phrase> D#1010 "person who is author of a book" ((<concept> (C#1101 "person")) (<joiner> (RS#0001 RL "is-author-of")) (<concept> (C#1122 "book")))) (35) ここで、複合名詞解析部は(35)式の最後の3行を受
けて、概念C#1101とC#1122とが関係(RS
#0001 RL)によって意味的に関係付けられ得る
ことを推論し、(36)式の解釈を最終的に得る。この
場合、(35)式は単一の候補しか示していないが、も
し仮りに、上記の推論に失敗した場合は、そのような意
味解釈は、知識ベースに記憶されている知識に照らして
みて、有り得ないことが分かったことを意味する。(<Noun-phrase> D # 1010 "person who is author of a book"((<concept> (C # 1101 "person")) (<joiner> (RS # 0001 RL "is-author-of ")) (<concept> (C # 1122" book "))))) (35) Here, the compound noun analysis unit receives the last three lines of the expression (35) and receives the concepts C # 1101 and C # 1122. Is related (RS
# 0001 RL), and finally obtain the interpretation of equation (36). In this case, equation (35) shows only a single candidate, but if the above inference failed, such a semantic interpretation would be based on knowledge stored in the knowledge base. Means that it is impossible.
【0105】 (D#1010 "person who is author of a book" (C#1101 ((RS#0001 RL) C#1122))) (36) (36)式を自然言語的に表示すると下記のようにな
る。(D # 1010 "person who is author of a book" (C # 1101 ((RS # 0001 RL) C # 1122))) (36) When the expression (36) is displayed in a natural language, it is as follows. become.
【0106】"person who is author of book" 最後に、図11の例を説明する。(37)式に示すパー
ジング結果において、二番目の結合子(joiner)は、前
置詞atを図12に示す前置詞テーブル601を参照し
て解釈したものであり、その結果として複数の解釈が列
挙されている。"Person who is author of book" Finally, an example of FIG. 11 will be described. In the parsing result shown in Expression (37), the second joiner is obtained by interpreting the preposition at with reference to the preposition table 601 shown in FIG. 12, and as a result, a plurality of interpretations are listed. I have.
【0107】 (<noun-phrase> D#1011 "articles on people at companies" ((<concept> (C#0401 "article")) (<joiner> (RS#0033 LR "subject-is")) (<concept> (C#0601 "person")) (<joiner> (RS#0123 LR "is-developed-at") (RS#1054 LR "is-located-in") ・・・ (RS#0209 RL "works-at") ・・・) (<concept> (C#1022 "company"))) (37) 複合名詞解析部506は(37)式の第4要素を入力し
て、「概念−結合子−概念」という3組毎に、原理説明
で述べた考え方により意味的な関係の妥当性を評価す
る。すなわち、二番目の3組の例でいうと、概念C#0
601(person)と概念C#1022(company)との
間に、関係 "is-developed-at" や "is-located-in" は
有り得なく、関係 "works-at" のみが意味的に妥当であ
ることを、知識ベースに記憶されている具体的な事実か
ら推論する。この場合には、(38)式の解釈が最終的
に得られる。(<Noun-phrase> D # 1011 "articles on people at companies"((<concept> (C # 0401 "article")) (<joiner> (RS # 0033 LR "subject-is"))) <concept> (C # 0601 "person")) (<joiner> (RS # 0123 LR "is-developed-at") (RS # 1054 LR "is-located-in") ・ ・ ・ (RS # 0209 RL "works-at") ・ ・ ・) (<concept> (C # 1022 "company"))) (37) The compound noun analysis unit 506 inputs the fourth element of the expression (37) and returns "concept-join". The validity of the semantic relationship is evaluated for each of the three sets of “child-concepts” according to the concept described in the principle description.
There is no relation "is-developed-at" or "is-located-in" between 601 (person) and concept C # 1022 (company), and only the relation "works-at" is semantically valid. Something is inferred from concrete facts stored in the knowledge base. In this case, the interpretation of equation (38) is finally obtained.
【0108】 (D#1011 "articles on people at companies" (C#0401 ((RS#0033 LR) (C#0601 ((RS#0209 RL) C#1022))))) (38) 解釈(38)式は、自然言語で表示すると下記のように
なる。(D # 1011 "articles on people at companies") (C # 0401 ((RS # 0033 LR) (C # 0601 ((RS # 0209 RL) C # 1022)))))) (38) Interpretation (38 The expression is expressed as follows in natural language.
【0109】 次に、本発明方式による知識ベースシステムの次の要素
であるマルチメディアファイル管理プログラムについて
説明する。知識ベースは記号的にオブジェクトまたは概
念を記憶するのに対して、マルチメディアファイルは、
情報自体をメディアのままで記憶する。すなわち、情報
圧縮のために各々最適な符号化を行うが、写真、文書、
図面、テキスト、音声といった複数の異なる種類のメデ
ィア情報(マルチメディア情報)を所定の記述方式に従
って記憶・管理する。マルチメディア情報の記述方式に
ついては、標準化されるべきマルチメディア・コンテン
ツ・アーキテクチャ(例えば、ODA:オフィス・ドキ
ュメント・アーキテクチャ)が知られているので、ここ
では説明しない。[0109] Next, a multimedia file management program which is the next element of the knowledge base system according to the present invention will be described. While a knowledge base stores objects or concepts symbolically, multimedia files are
The information itself is stored as media. In other words, each performs optimal encoding for information compression, but photographs, documents,
A plurality of different types of media information (multimedia information) such as drawings, texts, and voices are stored and managed according to a predetermined description method. The description method of the multimedia information is not described here because a multimedia content architecture (for example, ODA: office document architecture) to be standardized is known.
【0110】これらのマルチメディア情報は、所定の単
位で管理され、一つのオブジェクト(情報単位)を構成
する。例えば、「文書」、「記事」、「写真」、「図
表」、「一区切りの音声メッセージ」等々、我々が通常
一つの物として認知するものをオブジェクトとすること
ができる。このオブジェクトは、単一メディアであって
も良いし、マルチメディアであっても良い。これらオブ
ジェクトは、マルチメディアファイル管理プログラムに
よって、各情報単位に付けたファィルメンバ名称、物理
的ファイルにおける記憶位置および記憶レコード長、記
述形式(例えば符号化方式)等から成る管理情報によっ
て管理する。複数のオブジェクトが構造化されて、別の
オブジェクトを構成することも可能である。逆に、ある
オブジェクトを複数の部分オブジェクトの構造体として
管理することも可能である。The multimedia information is managed in a predetermined unit, and forms one object (information unit). For example, objects that we usually recognize as one thing, such as “document”, “article”, “photograph”, “chart”, “single-segment voice message”, etc., can be objects. This object may be a single media or a multimedia. These objects are managed by a multimedia file management program using management information including a file member name assigned to each information unit, a storage position and a storage record length in a physical file, a description format (for example, an encoding method), and the like. A plurality of objects can be structured to form another object. Conversely, an object can be managed as a structure of a plurality of partial objects.
【0111】一方、マルチメディアファイルに格納され
ている各情報単位は、先述したように、概念ネットワー
クの任意の概念ノードに関連付けることが出来る。これ
によって、マルチメディアファイルに格納されている情
報本体を、概念ネットワーク形の知識ベースから知的に
推論を用いて検索することが可能である。On the other hand, each information unit stored in the multimedia file can be associated with an arbitrary concept node of the concept network as described above. As a result, it is possible to intelligently search for the information body stored in the multimedia file from the concept network type knowledge base by using inference.
【0112】次に、統合知識ベースについて述べる。本
発明方式による知識ベースシステムは、これまでに説明
した如く、概念関係モデルに基づく概念ネットワーク形
知識ベース、構文規則を記憶した文法ファイル、上記知
識ベースから編集処理によって自動的に作成できる言語
的辞書(語彙辞書512)、ユーザが個人毎に定義でき
る概念辞書(構造化概念ファイル511)、およびマル
チメディアファイルとから構成されていることを特徴と
している。更に、本システムは、知識ベース内の概念と
マルチメディアファイル内のオブジェクトを関連付ける
記憶手段とを有している。このように、記号的・論理的
表現による知識・情報、言語的知識、およびメディア情
報とを有機的に記憶することが出来る知識ベースを、こ
こでは統合知識ベースと呼ぶ。これらの情報は、それぞ
れの特性に合わせて、統合ディスクユニットに記憶させ
る。Next, the integrated knowledge base will be described. As described above, the knowledge base system according to the present invention includes a concept network type knowledge base based on a concept relation model, a grammar file storing syntax rules, and a linguistic dictionary which can be automatically created from the knowledge base by editing. (Vocabulary dictionary 512), a concept dictionary (structured concept file 511) that the user can define for each individual, and a multimedia file. In addition, the system has storage means for associating concepts in the knowledge base with objects in the multimedia file. Such a knowledge base that can organically store knowledge / information by symbolic / logical expressions, linguistic knowledge, and media information is referred to herein as an integrated knowledge base. These pieces of information are stored in the integrated disk unit according to the respective characteristics.
【0113】以上、本発明を特に英語の場合について説
明したが、原理的には、日本語等、他の言語にも同様に
拡張可能である。特に、知識表現方式の説明で述べたよ
うに、本発明によれば、容易に多国語システムに拡張す
ることが出来る。具体的には、知識表現手段のうち、概
念名称テーブル221(図3)と一般概念定義テーブル
241(図5)のみが言語に依存し、同時に、それらの
テーブルは言語を規定するフィールド(カラム)LAN
G,224および246を有している。Although the present invention has been described with particular reference to the case of English, in principle, the present invention can be similarly extended to other languages such as Japanese. In particular, as described in the description of the knowledge expression method, according to the present invention, the system can be easily extended to a multilingual system. Specifically, among the knowledge expressing means, only the concept name table 221 (FIG. 3) and the general concept definition table 241 (FIG. 5) depend on the language, and at the same time, those tables are defined by fields (columns) defining the language. LAN
G, 224 and 246.
【0114】また、本発明は実施例で示した構文規則の
内容(リスト1)に限定されることなく、同構文規則を
変更・拡張することにより、より広範な、或いは別なシ
ステムに適した自然言語を受け付けられることは自明で
ある。その意味でも、本発明方式は、広い応用分野を持
つ。例えば、詳細に説明しなかったが、リスト1におい
ても、(29a)から(29e)は、自然言語を用いて
新しい概念の登録(29b)、一般関係の登録(29
a)、或いは新しい事実の登録(29d)等を行うこと
が可能であることを示している。Further, the present invention is not limited to the contents of the syntax rules shown in the embodiment (List 1), and can be adapted to a wider or different system by changing and expanding the syntax rules. It is self-evident that natural language can be accepted. In this sense, the method of the present invention has a wide field of application. For example, although not described in detail, even in the list 1, (29a) to (29e) indicate registration of a new concept using natural language (29b) and registration of a general relationship (29b).
a) or registration of a new fact (29d) or the like is possible.
【0115】更にまた、実施例の説明では、マルチメデ
ィアファィルと結合したシステムを述べたが、同マルチ
メディアファイルと独立して、知識ベースシステムのみ
で用いても効果的であることは言うまでもない。Further, in the description of the embodiment, the system combined with the multimedia file has been described. However, it is needless to say that it is effective to use only the knowledge base system independently of the multimedia file.
【0116】[0116]
【発明の効果】以上説明した如く、本発明によれば、ユ
ーザは学習することが難しい形式言語を覚えることな
く、自然言語を用いて、曖昧な記憶から思い起こされる
記述的な検索要求から知識ベース内の欲しい情報を取り
出すことが可能となる。通常、我々の記憶は時間ととも
に薄らいでいくが、その時に残る記憶は、断片的であ
り、かつ抽象化していく。或いは、ずばりその名称を記
憶していることは稀であり、「こんなもの」、「あんな
もの」といった記述的なものに成っていくことも知られ
ている。本発明方式は、断片的、或いは抽象的な記述か
ら検索する方式を与えており、その意味では、単に自然
言語で検索できること以上の効果を有している。As described above, according to the present invention, a user can learn a formal language using a natural language without using a formal language which is difficult to learn, and from a descriptive search request recalled from an ambiguous memory. It is possible to extract desired information from within. Normally, our memories fade over time, but the memories that remain at that time are fragmentary and abstract. Alternatively, it is rare that the name is memorized, and it is also known that the name becomes descriptive such as "this kind" or "that kind". The method of the present invention provides a method of searching from a fragmentary or abstract description, and in that sense, has an effect more than simply searching in a natural language.
【0117】また、本発明によれば、自然言語理解に必
要な知識は、システム本来の知識とともに知識ベース内
に一体となって記憶されているため、上記のようなシス
テムを構築することが、従来の自然言語インターフェー
スを与える方式に比べて、容易である。具体的には、ユ
ーザは特に自然言語インターフェースと知識ベースの整
合性などについて意識する必要はなく、知識ベースに本
来記憶管理させたい情報の登録に注目しさえすれば良
い。Further, according to the present invention, the knowledge necessary for understanding a natural language is stored together with the original knowledge of the system in the knowledge base. It is easier than the conventional method of providing a natural language interface. Specifically, the user does not need to be particularly conscious of the consistency between the natural language interface and the knowledge base, but only needs to pay attention to the registration of information that is to be stored and managed in the knowledge base.
【0118】更に、本発明によれば、新しい知識の登録
も自然言語を用いて行うことが可能である。一般的に、
複雑な機能を有するシステムでは、視覚的(直接操作
的)インターフェースと言語的インターフェースとの共
存が重要である。本方式では、視覚的(ビジュアル)イ
ンターフェースに言語的インターフェース機能が統合化
されており、ほとんど全ての機能を自然言語と直接操作
により提供している。その意味で、ユーザはその場その
場で、好きな方を選択することが出来、操作性および使
い勝手の面で優れている。Further, according to the present invention, it is possible to register new knowledge using a natural language. Typically,
In a system having a complex function, coexistence of a visual (direct operation) interface and a linguistic interface is important. In this method, a linguistic interface function is integrated with a visual interface, and almost all functions are provided by natural language and direct operation. In that sense, the user can select a favorite one on the spot, and is excellent in operability and usability.
【0119】更にまた、本発明では、概念に対して同義
語、異表記語といった別名を登録したり、関係の名称
(「読み」)に対しても別名を記憶・登録させる手段を
与えており、多様な検索要求の表現に対しても適切に検
索処理を実行することが出来る。Further, the present invention provides a means for registering an alias such as a synonym and a different notation for a concept, and for storing and registering an alias for a relation name ("reading"). In addition, it is possible to appropriately execute search processing even for expressions of various search requests.
【0120】また、本発明は、マルチメディア情報を知
識ベースに統合する方式についても示しており、これに
従えば、従来の記号的表現による知識ベース以上の応用
分野を切り開くことが可能である。The present invention also discloses a method of integrating multimedia information into a knowledge base, and according to this, it is possible to open up an application field beyond the conventional knowledge base using symbolic expressions.
【0121】或いはまた、拡張例として述べた方式に従
って他国語システムを構築すれば、例えば、英語で検索
して日本語で出力すると言ったことも実現できる。Alternatively, if a foreign language system is constructed in accordance with the method described as an extended example, it is possible to realize, for example, a search in English and output in Japanese.
【図1】本発明方式の自然言語文解釈プログラムの機能
ブロック図。FIG. 1 is a functional block diagram of a natural language sentence interpretation program according to the present invention.
【図2】概念関係モデルによる知識表現方式を説明する
概念ネットワークの図。FIG. 2 is a conceptual network diagram illustrating a knowledge expression method using a conceptual relationship model.
【図3】同モデルによる知識記憶を示す図であり、概念
名称を示す図。FIG. 3 is a diagram showing knowledge storage based on the model, and showing concept names.
【図4】同モデルによる知識記憶を示す図であり、包摂
関係を示す図。FIG. 4 is a diagram showing knowledge storage by the same model, showing a subsumption relationship.
【図5】同モデルによる知識記憶を示す図であり、一般
関係定義を示す図。FIG. 5 is a diagram showing knowledge storage by the same model, showing a general relationship definition.
【図6】同モデルによる知識記憶を示す図であり、関係
を示す図。FIG. 6 is a diagram showing knowledge storage by the same model and showing a relationship.
【図7】同モデルによる知識記憶を示す図であり、複合
名詞句の意味解釈法の原理を説明するための図。FIG. 7 is a diagram illustrating knowledge storage by the same model, and is a diagram for explaining the principle of a method of interpreting the meaning of a compound noun phrase.
【図8】同モデルによる知識記憶を示す図であり、構文
解析法を説明する図。FIG. 8 is a diagram illustrating knowledge storage by the model, and is a diagram illustrating a syntax analysis method.
【図9】同モデルによる知識記憶を示す図であり、構文
解析例を示す図。FIG. 9 is a diagram illustrating knowledge storage by the model, and is a diagram illustrating a syntax analysis example.
【図10】同モデルによる知識記憶を示す図であり、構
文解析例を示す図。FIG. 10 is a diagram showing knowledge storage by the model, and showing an example of syntax analysis.
【図11】同モデルによる知識記憶を示す図であり、構
文解析例を示す図。FIG. 11 is a diagram illustrating knowledge storage by the model, and is a diagram illustrating a syntax analysis example.
【図12】同モデルによる知識記憶を示す図であり、前
置詞を示す図。FIG. 12 is a diagram showing knowledge storage by the same model, showing a preposition.
【図13】同モデルによる知識記憶を示す図であり、関
係記述子を示す図。FIG. 13 is a diagram showing knowledge storage by the same model, showing a relation descriptor.
【図14】同モデルによる知識記憶を示す図であり、本
発明の一実施例システムのハードウェア構成図。FIG. 14 is a diagram showing knowledge storage according to the same model, and is a hardware configuration diagram of a system according to an embodiment of the present invention.
503…語彙解析部、504…構文解析部、506…複
合名詞解析部、511…構造化概念ファイル、512…
語彙辞書、514…構文規則文法ファイル、221…概
念名称テーブル、231…包摂関係テーブル、241…
一般関係定義テーブル、251…関係テーブル、601
…前置詞テーブル、611…関係記述子テーブル。503: Vocabulary analysis unit, 504: Syntax analysis unit, 506: Compound noun analysis unit, 511: Structured concept file, 512 ...
Vocabulary dictionary, 514 ... syntax rule grammar file, 221 ... concept name table, 231 ... subsumption relation table, 241 ...
General relation definition table, 251,... Relation table, 601
... a preposition table, 611 ... a relation descriptor table.
フロントページの続き (72)発明者 木内 伊都子 東京都国分寺市東恋ケ窪1丁目280番地 株式会社日立製作所中央研究所内 (56)参考文献 特開 昭59−223883(JP,A) 特開 昭61−220027(JP,A) 特開 昭58−56071(JP,A) 特開 昭61−150592(JP,A) 特開 昭62−86429(JP,A) 特開 昭63−213066(JP,A) 藤澤浩道ほか,「概念ネットワークを 用いた知的ファイリングシステム」,日 立評論vol.69,no.3(昭和62年 3月)pp29−36 藤澤浩道,東野純一,畠山敦,「概念 ネットワークによる意味的検索方式 − 知的ファイリング(その5)−」,情報 処理学会第31回(昭和60年後期)全国大 会講演論文集(II),pp.1087− 1088(昭和60年9月9日) (58)調査した分野(Int.Cl.6,DB名) G06F 17/30 G06F 17/28 Continuing from the front page (72) Inventor Itiko Kiuchi 1-280 Higashi Koikekubo, Kokubunji-shi, Tokyo Inside the Central Research Laboratory, Hitachi, Ltd. (56) References JP-A-59-223883 (JP, A) JP-A-61-220027 ( JP, A) JP-A-58-56071 (JP, A) JP-A-61-150592 (JP, A) JP-A-62-86429 (JP, A) JP-A-63-213066 (JP, A) Hiromichi Fujisawa In addition, "Intelligent filing system using concept network", Hitachi Review, vol. 69, no. 3 (March 1987) pp. 29-36 Hiromichi Fujisawa, Junichi Higashino, Atsushi Hatakeyama, "Conceptual Network Semantic Retrieval Method-Intelligent Filing (Part 5)-", Information Processing Society of Japan 31st ) National Convention Lecture Papers (II), pp. 1087-1088 (September 9, 1985) (58) Field surveyed (Int. Cl. 6 , DB name) G06F 17/30 G06F 17/28
Claims (3)
て、それらの関係が記述されていない複数の単語からな
る名詞を含む自然言語文を入力する入力手段と、 名詞の概念をノードとして表し、概念間の関係をリンク
として表し、ノードとリンクで概念木を構成する概念ネ
ットワークを知識とする知識ベースを記憶するメモリ
と、 上記知識ベースを参照して上記自然言語文の意味解析処
理を行う処理装置と、 処理結果を出力する出力装置と、を備え、 上記複数の単語からなる名詞が上記概念ネットワーク中
の1つの概念として存在しない場合に、該名詞に対して
上記概念ネットワークを検索し、該検索により上記名詞
を構成する複数の単語の概念の間の関係式で表されてい
る構造化概念定義式を得て、上記メモリに更に記憶し、
上記構造化概念定義式を上記知識ベースと共に参照して
上記意味解析処理を行うことを特徴とするデータベース
装置。1. An input means for inputting a natural language sentence including a plurality of words each having a concept, and a plurality of words having no relationship described therein, and a concept of the noun as a node, A memory that stores a knowledge base that expresses a relationship between concepts as a link and a concept network that forms a concept tree with nodes and links, and performs a semantic analysis process of the natural language sentence with reference to the knowledge base And an output device for outputting a processing result. When the noun composed of the plurality of words does not exist as one concept in the concept network, the concept network is searched for the noun, Obtaining a structured concept definition expression represented by a relational expression between the concepts of a plurality of words constituting the noun by search, and further storing in the memory,
A database device, wherein the semantic analysis process is performed by referring to the structured concept definition expression together with the knowledge base.
する概念名称テーブルと、上記概念間の包摂関係を記憶
する包摂関係テーブルと、上記概念間に存在する包摂関
係以外の関係の定義を記憶する一般関係定義テーブル
と、上記概念間の関係の存在を記憶する関係テーブルを
有する特許請求の範囲第1項記載のデータベース装置。2. The knowledge base includes a concept name table storing names of the concepts, a subsumption relation table storing the subsumption relations between the concepts, and a definition of relations other than the subsumption relations existing between the concepts. 2. The database device according to claim 1, comprising a general relation definition table for storing, and a relation table for storing existence of a relation between the concepts.
属性を解析する語彙解析処理と、構文規則を記憶した文
法ファイル、上記知識ベース、および上記語彙解析処理
の解析結果を参照して、上記名詞の構文を解析する構文
解析処理とを有する特許請求の範囲第2項記載のデータ
ベース装置。3. The semantic analysis process includes a vocabulary analysis process for analyzing attributes of each word of the noun, a grammar file storing syntax rules, the knowledge base, and an analysis result of the vocabulary analysis process. 3. The database device according to claim 2, further comprising a syntax analysis process for analyzing the syntax of the noun.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP8326482A JP2948159B2 (en) | 1996-12-06 | 1996-12-06 | Database device |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP8326482A JP2948159B2 (en) | 1996-12-06 | 1996-12-06 | Database device |
Related Parent Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP63002609A Division JP2997469B2 (en) | 1985-03-27 | 1988-01-11 | Natural language understanding method and information retrieval device |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH09190453A JPH09190453A (en) | 1997-07-22 |
| JP2948159B2 true JP2948159B2 (en) | 1999-09-13 |
Family
ID=18188316
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP8326482A Expired - Lifetime JP2948159B2 (en) | 1996-12-06 | 1996-12-06 | Database device |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2948159B2 (en) |
Families Citing this family (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5933822A (en) * | 1997-07-22 | 1999-08-03 | Microsoft Corporation | Apparatus and methods for an information retrieval system that employs natural language processing of search results to improve overall precision |
| US6792418B1 (en) | 2000-03-29 | 2004-09-14 | International Business Machines Corporation | File or database manager systems based on a fractal hierarchical index structure |
| WO2004066164A1 (en) * | 2003-01-23 | 2004-08-05 | Fujitsu Limited | Topic net generation method and apparatus |
| US7756897B2 (en) | 2003-01-23 | 2010-07-13 | Fujtisu Limited | Topic net generation method and apparatus |
| US8583435B2 (en) * | 2006-03-10 | 2013-11-12 | Nec Corporation | Request content identification system, request content identification method using natural language, and program |
| JP6729095B2 (en) * | 2016-07-05 | 2020-07-22 | 富士ゼロックス株式会社 | Information processing device and program |
| JP7172497B2 (en) * | 2018-11-22 | 2022-11-16 | 富士フイルムビジネスイノベーション株式会社 | Information processing device and program |
| CN111221984B (en) * | 2020-01-15 | 2024-03-01 | 北京百度网讯科技有限公司 | Multimodal content processing methods, devices, equipment and storage media |
-
1996
- 1996-12-06 JP JP8326482A patent/JP2948159B2/en not_active Expired - Lifetime
Non-Patent Citations (2)
| Title |
|---|
| 藤澤浩道,東野純一,畠山敦,「概念ネットワークによる意味的検索方式 −知的ファイリング(その5)−」,情報処理学会第31回(昭和60年後期)全国大会講演論文集(II),pp.1087−1088(昭和60年9月9日) |
| 藤澤浩道ほか,「概念ネットワークを用いた知的ファイリングシステム」,日立評論vol.69,no.3(昭和62年3月)pp29−36 |
Also Published As
| Publication number | Publication date |
|---|---|
| JPH09190453A (en) | 1997-07-22 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US6182062B1 (en) | Knowledge based information retrieval system | |
| US5404506A (en) | Knowledge based information retrieval system | |
| US11113304B2 (en) | Techniques for creating computer generated notes | |
| US6269189B1 (en) | Finding selected character strings in text and providing information relating to the selected character strings | |
| RU2509350C2 (en) | Method for semantic processing of natural language using graphic intermediary language | |
| US20100121630A1 (en) | Language processing systems and methods | |
| KR20100038378A (en) | A method, system and computer program for intelligent text annotation | |
| Wynne | Searching and concordancing | |
| Wu | Modelling linguistic resources: A systemic functional approach | |
| JP2948159B2 (en) | Database device | |
| Nguyen et al. | Ensuring annotation consistency and accuracy for Vietnamese treebank | |
| JP2997469B2 (en) | Natural language understanding method and information retrieval device | |
| Belkebir et al. | TALAA-ATSF: a global operation-based arabic text summarization framework | |
| Suchowolec et al. | An empirically validated, onomasiologically structured, and linguistically motivated online terminology: Re-designing scientific resources on German grammar | |
| JPH06231178A (en) | Document retrieval device | |
| JP2546245B2 (en) | Natural language sentence generation method | |
| Du | On the use of natural language processing for automated conceptual data modeling | |
| JPH07114565A (en) | Electronic dictionary | |
| Shinzato et al. | A Patten Matcher for English Idioms on Web IndeX | |
| JPH0561902A (en) | Mechanical translation system | |
| JP4938298B2 (en) | Method and program for outputting candidate sentences to be included in text summary | |
| JP2002544616A (en) | Method and apparatus for processing free format data | |
| Balcha et al. | Design and Development of Sentence Parser for Afan Oromo Language | |
| JP2819766B2 (en) | Foreign language electronic dictionary search method | |
| JP3281361B2 (en) | Document search device and document search method |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080702 Year of fee payment: 9 |
|
| EXPY | Cancellation because of completion of term | ||
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080702 Year of fee payment: 9 |