Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JPH0682363B2 - Document processor - Google Patents
[go: Go Back, main page]

JPH0682363B2 - Document processor - Google Patents

Document processor

Info

Publication number
JPH0682363B2
JPH0682363B2 JP62008834A JP883487A JPH0682363B2 JP H0682363 B2 JPH0682363 B2 JP H0682363B2 JP 62008834 A JP62008834 A JP 62008834A JP 883487 A JP883487 A JP 883487A JP H0682363 B2 JPH0682363 B2 JP H0682363B2
Authority
JP
Japan
Prior art keywords
sentence
keyword
concept
candidate
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP62008834A
Other languages
Japanese (ja)
Other versions
JPS63175965A (en
Inventor
育雄 芥子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP62008834A priority Critical patent/JPH0682363B2/en
Publication of JPS63175965A publication Critical patent/JPS63175965A/en
Publication of JPH0682363B2 publication Critical patent/JPH0682363B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Transfer Between Computers (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】 <産業上の利用分野> 本発明は,利用者によって作成された文章や,電子メー
ル等から入力された文章を自動的に分類し,中身の概要
を表わす要約テーブルを生成することにより,効率的な
文書管理が可能な文書処理装置に関する。
DETAILED DESCRIPTION OF THE INVENTION <Industrial field of application> The present invention automatically classifies sentences created by a user or sentences entered from an electronic mail or the like, and creates a summary table showing an outline of the contents. The present invention relates to a document processing device that enables efficient document management by generating the document.

<従来技術> 従来,文書処理装置である日本語ワードプロセッサや欧
米ワードプロセッサにおいては,ビジネス文書等の比較
的定型の文書を作成する場合に,過去に作成された文書
がそのまま使えたり,一部を修正するだけで新しい文書
を効率良く作成できることが往々であった。またそれが
ワードプロセッサの大きな利点でもあった。
<Prior Art> Conventionally, in a Japanese word processor or a Western word processor which is a document processing device, when a relatively standard document such as a business document is created, a document created in the past can be used as it is or a part thereof is modified. It was often the case that a new document could be efficiently created simply by doing. It was also a big advantage of word processors.

このため所望の文章を容易に探すことができるように,
予め分類体系を設定し,その基に利用者が作成した文書
を分類し,文書の内容を象徴するような名前(文書名)
をつけて補助記憶装置上に格納していた。
Therefore, in order to easily find the desired sentence,
A name that sets the classification system in advance, classifies the documents created by the user based on the classification system, and symbolizes the contents of the document (document name)
Was stored on the auxiliary storage device.

<発明が解決しようとする問題点> しかし利用者が,新しく作成した文書を分類体系のどこ
かに分類するかを決めるには分類体系を全て把握してい
る必要があった。しかも複数の利用者が同じ文書処理装
置を使っている場合には,全ての利用者の判断基準が同
じでなければならなかった。従って文書をその内容によ
って画一的に分類することは非常に困難であった。
<Problems to be Solved by the Invention> However, in order for a user to decide whether to classify a newly created document somewhere in the classification system, it was necessary to grasp all the classification systems. Moreover, when a plurality of users are using the same document processing device, all users must have the same criteria. Therefore, it is very difficult to classify documents uniformly according to their contents.

また,同じ所に分類された文書についても格納されてい
る文書の数が多くなれば同じような名前が増加し,文書
名だけでその中味を判断することができなくなってい
た。例えば,「案内」という文書名をもつ文書は,大き
く分類すると a)パーティーの案内 b)会議の案内 c)大売出しの案内 等があり,それぞれにまた個別の内容を持つ文書がいろ
いろある。
Also, regarding the documents classified into the same place, the number of similar documents increases as the number of stored documents increases, and the contents cannot be judged only by the document name. For example, documents with the document name “guidance” are roughly classified into a) party guidance, b) conference guidance, and c) large sale guidance, etc., and there are various documents with individual contents.

従って,多くの文書の中から利用者が真に望むものを選
択するためには,文書名と同時に文書の中味も確認する
必要があり,非常に面倒であった。
Therefore, in order to select what a user truly desires from many documents, it is necessary to check the document contents as well as the document name, which is very troublesome.

<発明の目的> 本発明は,上述の従来問題点を解決するものであり,文
書を補助記憶装置上に格納する際にその文書の内容を象
徴する概念に分類し要約テーブルを自動生成すること
で,後にその文書を検索する作業を効率的に実行可能な
新規な文書処理装置を提供することを目的とする。
<Object of the Invention> The present invention solves the above-mentioned conventional problems, and when a document is stored in an auxiliary storage device, it is classified into concepts that symbolize the contents of the document and a summary table is automatically generated. It is therefore an object of the present invention to provide a new document processing device capable of efficiently performing the work of retrieving the document later.

<実施例> 以下,本発明に係る文書処理装置の一実施例について図
面を用いて詳細に説明を行う。
<Embodiment> An embodiment of the document processing apparatus according to the present invention will be described in detail below with reference to the drawings.

第1図は,本実施例の文書処理装置の基本構成を示す。
文書処理装置1は,キーボード2により入力された文章
を表示装置3に表示するとともに,文書を編集作成して
第1補助記憶装置4(例えばフロッピーディスク)に格
納する。
FIG. 1 shows the basic configuration of the document processing apparatus of this embodiment.
The document processing device 1 displays the text input by the keyboard 2 on the display device 3, edits and creates the document, and stores it in the first auxiliary storage device 4 (for example, a floppy disk).

キーワード抽出手段6は,入力された文章から辞書5を
用いて複数の単語を抽出し,その抽出した単語群から上
位概念のキーワード候補を導き出す。
The keyword extracting means 6 extracts a plurality of words from the input sentence using the dictionary 5, and derives keyword candidates of a superordinate concept from the extracted word group.

文章概念制御手段8は,キーワード抽出手段6により抽
出されたキーワード候補から概念・キーワード関係表7
を用いて,文章の内容を象徴する概念の候補とキーワー
ド候補の中からその概念候補に適したキーワードの組み
合わせを決定する。
The sentence concept control means 8 uses the keyword candidates extracted by the keyword extraction means 6 from the concept / keyword relationship table 7
Using, the keyword combination suitable for the concept candidate is determined from the concept candidate and the keyword candidate that symbolize the content of the sentence.

キーワード解析手段10は,文章概念制御手段8で決定さ
れたキーワードの組み合わせの中から規則表9に記述さ
れた特に重要なキーワードについて,文章中でそのキー
ワードに変換された単語の前後の文章を解析して情報を
抽出する。
The keyword analysis means 10 analyzes the sentences before and after the word converted into the keyword in the sentence regarding a particularly important keyword described in the rule table 9 from the combination of keywords determined by the sentence concept control means 8. And extract the information.

要約テーブル生成手段12は,フレーム蓄積部11に格納さ
れたフレームの中から文章概念制御手段8で候補となっ
た文章の概念に対応するフレームを用いてキーワード解
析手段10で抽出された情報から文章の概念が正解かどう
かをテストし,成功すれば要約テーブルを生成し第2候
補記憶装置13(例えばフロッピーディスクであり第1補
助記憶装置4と共用してもよい)に格納する。失敗すれ
ば文章概念制御手段8の次候補の文章の概念とキーワー
ドの組み合わせについて同様の処理を行う。
The summary table generating means 12 uses the frame corresponding to the concept of the sentence selected by the sentence concept controlling means 8 from the frames stored in the frame accumulating section 11 to extract the sentence from the information extracted by the keyword analyzing means 10. If the result is successful, a summary table is generated and stored in the second candidate storage device 13 (for example, a floppy disk, which may be shared with the first auxiliary storage device 4). If unsuccessful, the same process is performed for the combination of the concept of the next candidate sentence and the keyword of the sentence concept control means 8.

以下,この文書処理装置の動作について説明する。The operation of this document processing apparatus will be described below.

例えば,利用者がキーボード2を用いて 「さて,1月2日にご注文賜りましたコンデンサーを宅配
便で送りました」 ……(1) と入力したとする。文書処理装置1は,入力された文章
を単語単位に分割し,キーワード抽出手段6に与える。
辞書5と概念・キーワード関係表7を結合した概念図を
第2図に示す。キーワード抽出手段6では文中の単語
「注文」,「コンデンサー」,「送り」から辞書5(10
1)を用いて,この単語群を「注文」→「発注」「要
求」,「コンデンサー」→「商品」,「送り」→「派
遣」「経過」「発送」の様に各々キーワード候補に変換
する。以上の処理によってキーワード抽出手段では「発
注,要求,商品,派遣,経過,発送」の6つのキーワー
ド候補が抽出される。
For example, suppose that the user uses the keyboard 2 and inputs "Well, I sent the capacitor you ordered on January 2 by courier" ... (1). The document processing apparatus 1 divides the input sentence into word units, and gives the divided words to the keyword extracting means 6.
A conceptual diagram in which the dictionary 5 and the concept / keyword relationship table 7 are combined is shown in FIG. The keyword extracting means 6 uses the words "order", "condenser", and "feed" in the sentence to extract the dictionary 5 (10
Using 1), convert this word group into keyword candidates such as "order" → "order""request","capacitor" → "product", "send" → "dispatch""progress""ship". To do. Through the above processing, the keyword extraction means extracts six keyword candidates of “ordering, request, product, dispatch, progress, shipping”.

次に文章概念制御手段8では抽出された上記6つのキー
ワード候補から概念・キーワード関係表7(102)を用
いて,文章の内容を象徴する概念候補とそれに関連した
キーワードの組み合わせが決定される。ここで概念・キ
ーワード関係表102は,文章の概念と関係のあるキーワ
ードを連続したものであり,例えば,概念「採用の通
知」はキーワード「人,派遣,要求etc」と接続されて
いる。この概念・キーワード関係表によってキーワード
の包括性から文章の概念候補が決定されると同時に,多
義語等辞書101上の曖味性が解消される。以上の処理に
よって文章概念制御手段8では,文章の概念候補として
「出荷の通知」,キーワードの組み合わせとして上記6
つのキーワード候補の中から「出荷の通知」に接続され
た「発注,商品,発送」の3つのキーワードが抽出され
る。
Next, the sentence concept control means 8 determines a combination of the concept candidate symbolizing the content of the sentence and the keyword related thereto from the extracted six keyword candidates by using the concept / keyword relationship table 7 (102). Here, the concept / keyword relationship table 102 is a series of keywords related to the concept of a sentence. For example, the concept “notice of adoption” is connected to the keywords “person, dispatch, request etc.”. With this concept / keyword relationship table, the concept candidate of the sentence is determined from the comprehensiveness of the keywords, and at the same time, the ambiguity in the dictionary 101 for polysemous words is eliminated. Through the above processing, the text concept control means 8 uses the “shipment notification” as a text concept candidate and the above 6 as a keyword combination.
From the one keyword candidate, three keywords “ordering, product, shipping” connected to “shipment notification” are extracted.

次にキーワード解析手段10では,抽出された上記3つの
キーワードの組み合わせの内,規則表9に記述されてい
るキーワードについて,文章(1)の中でそのキーワー
ドに変換された単語の前後の文章を解析して情報を抽出
する。
Next, in the keyword analysis means 10, regarding the keywords described in the rule table 9 among the extracted combinations of the above three keywords, the sentences before and after the word converted into the keyword in the sentence (1) are displayed. Analyze and extract information.

即ち規則表9には,例えばキーワード「発注」について IF THEN (〔発注〕+賜りました+X+を)→(立場:業者,注
文品:X) ……(2) の様な規則が登録されてある。これは,キーワード「発
注」に変換された文章中の単語の次に「賜りました」が
続き,何文字かの後「を」が続く場合には,この文章を
書いている人の立場は業者,即ち注文を受けた側の立場
であり,「賜りました」と「を」ではさまれた文字列X
が注文品の内容を示しているという規則が存在すること
を意味し,この関係が記憶されている。
That is, in the rule table 9, for example, the rule such as IF THEN ([Order] + Given + X +) → (Position: Dealer, Ordered product: X) (2) is registered for the keyword “Order”. is there. This means that if a word in the sentence converted into the keyword "ordering" is followed by "Gift" and some characters followed by "", the position of the person who wrote this sentence is It is the position of the trader, that is, the side that received the order, and the character string X that is sandwiched between "Gived" and "O"
Means that there is a rule that indicates the contents of the ordered product, and this relationship is stored.

以上の処理によってキーワード解析手段10では,文章
(1)から 注文日→1月2日 立場→業者 ……(3) 注文品→コンデンサー 発送手段→宅急便 といった文脈情報が抽出される。
By the above processing, the keyword analysis means 10 extracts the context information such as order date → January 2nd position → supplier ... (3) ordered product → capacitor delivery means → courier service from the sentence (1).

次に要約テーブル生成手段12が文章概念制御手段8で文
章(1)の概念候補となった「出荷の通知」に対応する
フレームを用いて(3)の情報を基に要約テーブルを生
成する。
Next, the summary table generation means 12 uses the text concept control means 8 to generate a summary table based on the information in (3) using the frame corresponding to the “notification of shipping” which is the concept candidate of the text (1).

例えば,「出荷の通知」フレームは次のような構成であ
る。
For example, the “shipment notification” frame has the following structure.

「出荷の通知」フレーム 立場:業者 注文日: 注文品: ……(4) 発送手段: 発送日: ここでフレーム中の':'の左側が属性名,右側が値を示
す。ここで予め値が入っている属性名,文章がそのフレ
ームの概念であるための制約条件を示している。また,
値が入っていない属性名((4)の例では注文日,注文
品,発送手段,発送日)はそのフレームの概念の文章が
一般に含む内容である。これらの値は,キーワード解析
手段10で抽出された文脈情報の単語情報で充填され,要
約テーブルが生成される。
"Notification of shipment" frame Position: Supplier Order date: Ordered item: (4) Delivery method: Delivery date: The left side of ":" in the frame shows the attribute name and the right side shows the value. Here, the constraint condition for the attribute name and the sentence having a value in advance to be the concept of the frame is shown. Also,
The attribute name that does not contain a value (in the example of (4), order date, ordered item, shipping means, shipping date) is the content that the text of the concept of the frame generally includes. These values are filled with the word information of the context information extracted by the keyword analysis means 10 to generate the summary table.

生成された要約テーブルは第2補助記憶装置13上で概念
である「出荷の通知」のクラスに分類されて格納され
る。また,文章(1)が蓄積されている第1補助記憶装
置4上のアドレスも同時に格納される。
The generated summary table is stored in the second auxiliary storage device 13 after being classified into the concept of “shipment notification” class. Further, the address on the first auxiliary storage device 4 where the sentence (1) is stored is also stored at the same time.

利用者が求める文書を引出す場合は,まず求める概念を
指定し,その概念に含まれる複数の要約テーブルを表示
せしめ,その中から該当する内容のものを指定すること
でそのアドレスから求める文書に適確且つ迅速にアクセ
スできる。
When a user wants to retrieve a document, he or she specifies the desired concept, displays a plurality of summary tables included in the concept, and specifies the relevant contents from among them to make it suitable for the document requested from the address. Accurate and quick access.

<発明の効果> 以上説明したように,本発明において,利用者が作成し
た文章や電子メール等から入力された文章をその内容で
自動的に分類し,中身の概要を表わす要約テーブルを附
けて格納されるため,要約テーブルの確認により利用者
が望む文書を容易に引き出すことができ,効率的な文書
管理が可能となる。
<Effects of the Invention> As described above, according to the present invention, sentences created by the user or sentences input from e-mail or the like are automatically classified according to their contents, and a summary table showing an outline of the contents is attached. Since it is stored, the user can easily retrieve the desired document by checking the summary table, and efficient document management becomes possible.

【図面の簡単な説明】[Brief description of drawings]

第1図は本発明の一実施例を示すブロック図,第2図は
本発明の辞書と概念キーワード関係表を結合した概念図
である。 図中,1……文書処理装置、2……キーボード、3……表
示装置、4……第1補助記憶装置、5,101……辞書、6
……キーワード抽出手段、7,102……概念・キーワード
関係表、8……文章・概念制御手段、9……規則表、10
……キーワード解析手段、11……フレーム蓄積部、12…
…要約テーブル生成手段、13……第2補助記憶装置
FIG. 1 is a block diagram showing an embodiment of the present invention, and FIG. 2 is a conceptual diagram in which a dictionary of the present invention and a conceptual keyword relation table are combined. In the figure, 1 ... Document processing device, 2 ... Keyboard, 3 ... Display device, 4 ... First auxiliary storage device, 5, 101 ... Dictionary, 6
…… Keyword extraction means, 7,102 …… Concept / keyword relationship table, 8 …… Sentence / concept control means, 9 …… Rule table, 10
...... Keyword analysis means, 11 …… Frame storage section, 12 ...
... summary table generating means, 13 ... second auxiliary storage device

Claims (1)

【特許請求の範囲】[Claims] 【請求項1】利用者が作成した任意の文章に含まれる単
語から解析によって前記単語の意味内容を象徴するキー
ワード候補を抽出するキーワード抽出手段と、 文章の内容を表す概念候補及び前記キーワード候補の中
から前記概念候補に適したキーワードの組み合わせを決
定する文章概念制御手段と、 前記キーワードの組み合わせの中で文章の意味を表現す
るのに重要なキーワードに対応する入力文章の中の単語
の前後の文章を解析して前記入力文章の文脈情報を抽出
するキーワード解析手段と、 前記文脈情報が前記概念候補の属性名と該属性名に対応
する値とからなるフレームに適合するか否かのテストを
行い、適合した時には前記概念候補の中から文章の概念
を決定すると共に、前記値に前記文脈情報の単語情報を
充填して要約テーブルを生成する要約テーブル生成手段
と、 前記文章の概念と対応づけて前記要約テーブル及び前記
入力文章のアドレスを格納する記憶手段と、を備えたこ
とを特徴とする文書処理装置。
1. A keyword extracting means for extracting a keyword candidate symbolizing the meaning content of the word from a word included in an arbitrary sentence created by a user by analysis, and a concept candidate representing the content of the sentence and the keyword candidate. Sentence concept control means for determining a keyword combination suitable for the concept candidate from among, and before and after the word in the input sentence corresponding to an important keyword to express the meaning of the sentence in the keyword combination. Keyword analysis means for analyzing a sentence to extract context information of the input sentence, and a test as to whether or not the context information matches a frame composed of the attribute name of the concept candidate and a value corresponding to the attribute name. When a match is made, the concept of the sentence is determined from the concept candidates, and the value is filled with the word information of the context information to summarize the table. A summary table generation unit to be generated, a storage unit for storing an address of the summary table and the input sentence in association with the concept of the sentence, a document processing apparatus characterized by comprising a.
JP62008834A 1987-01-16 1987-01-16 Document processor Expired - Fee Related JPH0682363B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62008834A JPH0682363B2 (en) 1987-01-16 1987-01-16 Document processor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62008834A JPH0682363B2 (en) 1987-01-16 1987-01-16 Document processor

Publications (2)

Publication Number Publication Date
JPS63175965A JPS63175965A (en) 1988-07-20
JPH0682363B2 true JPH0682363B2 (en) 1994-10-19

Family

ID=11703813

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62008834A Expired - Fee Related JPH0682363B2 (en) 1987-01-16 1987-01-16 Document processor

Country Status (1)

Country Link
JP (1) JPH0682363B2 (en)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0776971B2 (en) * 1989-03-17 1995-08-16 工業技術院長 Document abstract creation device
DE69132067T2 (en) * 1990-09-20 2000-11-16 Kabushiki Kaisha Nippon Conlux, Tokio/Tokyo Device for processing coins
JPH05101052A (en) * 1991-10-04 1993-04-23 Fuji Xerox Co Ltd Document preparation supporting device
US5948058A (en) * 1995-10-30 1999-09-07 Nec Corporation Method and apparatus for cataloging and displaying e-mail using a classification rule preparing means and providing cataloging a piece of e-mail into multiple categories or classification types based on e-mail object information
JP5388038B2 (en) * 2009-12-28 2014-01-15 独立行政法人情報通信研究機構 Document summarization apparatus, document processing apparatus, and program

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61248160A (en) * 1985-04-26 1986-11-05 Hitachi Ltd Document information registering system

Also Published As

Publication number Publication date
JPS63175965A (en) 1988-07-20

Similar Documents

Publication Publication Date Title
CN112307185B (en) Demonstration device
US6662152B2 (en) Information retrieval apparatus and information retrieval method
US5541838A (en) Translation machine having capability of registering idioms
JP7313069B2 (en) Search material information storage device
JP2001075966A (en) Data analysis system
JPH0682363B2 (en) Document processor
CN111681087A (en) Information processing method and device, computer readable storage medium and electronic equipment
JPH0782497B2 (en) Document processor
CN111144122B (en) Evaluation processing method, device, computer system and medium
CN107871254A (en) The method and device of data object information is provided
KR102518843B1 (en) Enterprise content management system using a latene dirichlet allocation
CN117909560A (en) Search method, training device, training equipment, training medium and training program product
US12353459B2 (en) Information processing apparatus and non- transitory computer readable medium
CN115495589A (en) Data retrieval method, device, equipment and storage medium
JP2006133933A (en) Computer processing method
JPH09179875A (en) Information retrieval device
KR20230071950A (en) Science and technology information swords that can generate and present not only direct information related to science and technology but also additional information
KR0162471B1 (en) A scheduler agent with nl interface
JP3210842B2 (en) Information processing device
JP7851525B1 (en) A program, answering device, and method for searching documents and providing answers to a question.
JPH0944521A (en) Index generating device and document retrieval device
JP2008003656A (en) Concept dictionary generation device, document classification device, concept dictionary generation method, and document classification method
JP2000090110A (en) Full-text search method and apparatus, and recording medium storing full-text search program
KR101137056B1 (en) Product information registration method and system using automatic product model recommendation logic
JP2002312363A (en) Information distribution method and information distribution device

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees