Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP5489872B2 - Claim structure information generation apparatus, claim structure information generation method, and program - Google Patents
[go: Go Back, main page]

JP5489872B2 - Claim structure information generation apparatus, claim structure information generation method, and program - Google Patents

Claim structure information generation apparatus, claim structure information generation method, and program Download PDF

Info

Publication number
JP5489872B2
JP5489872B2 JP2010137876A JP2010137876A JP5489872B2 JP 5489872 B2 JP5489872 B2 JP 5489872B2 JP 2010137876 A JP2010137876 A JP 2010137876A JP 2010137876 A JP2010137876 A JP 2010137876A JP 5489872 B2 JP5489872 B2 JP 5489872B2
Authority
JP
Japan
Prior art keywords
information
delimiter
clause
type
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010137876A
Other languages
Japanese (ja)
Other versions
JP2012003517A (en
Inventor
昭宏 新森
慎也 高木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Intec Inc Japan
Original Assignee
Intec Inc Japan
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Intec Inc Japan filed Critical Intec Inc Japan
Priority to JP2010137876A priority Critical patent/JP5489872B2/en
Publication of JP2012003517A publication Critical patent/JP2012003517A/en
Application granted granted Critical
Publication of JP5489872B2 publication Critical patent/JP5489872B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

本発明は、特許請求項の構造に関する情報である請求項構造情報を生成する請求項構造情報生成装置等に関する。   The present invention relates to a claim structure information generating apparatus and the like for generating claim structure information which is information related to the structure of a claim.

特許出願の対象書類である「特許請求の範囲」に記述される特許請求項は、通常、長文かつ独特の記述スタイルで記述されるため、専門家以外の人にとっては極めて読みにくいものになっている。これに対して、実際の特許請求項の記述で多用される、いくつかの定型的表現を手がかりとして構造解析を行う手法が提案されている(例えば、特許文献1、特許文献2、非特許文献1参照)。また、特許請求項に記述されている内容を簡易に把握して記憶しやすくするための縮約表現手法も提案されている(例えば、特許文献3参照)。   The claims described in “Claims”, which are the subject documents of patent applications, are usually written in a long and unique description style, which makes it extremely difficult for non-experts to read. Yes. On the other hand, a method of performing structural analysis using some fixed expressions often used in the description of actual patent claims has been proposed (for example, Patent Document 1, Patent Document 2, Non-Patent Document). 1). Further, a reduced expression method for easily grasping and storing the contents described in the claims has been proposed (see, for example, Patent Document 3).

特許第3908261号公報Japanese Patent No. 3908261 特許第4289871号公報Japanese Patent No. 4289871 特開2004−240604号公報JP 2004-240604 A

新森昭宏,奥村学,丸川雄三,岩山真,「手がかり句を用いた特許請求項の構造解析」,情報処理学会論文誌,Vol.45,No.3,p.891−905,2004年Akihiro Niimori, Manabu Okumura, Yuzo Marukawa, Makoto Iwayama, “Structural analysis of patent claims using clue phrases”, Transactions of Information Processing Society of Japan, Vol. 45, no. 3, p. 891-905, 2004

しかしながら、前述の特許文献1,2、非特許文献1は、特許請求項のトップレベルの構造を解析するものであり、より深い構造を持つ特許請求項については、構造解析がなされなかった。例えば、次のような特許請求項について、それらの提案手法を用いた場合には、図16で示されるように構造解析が行われ、「外部に接続されるダクトと、エアを排出する送風手段と、エアを清浄化する清浄化手段と、を備え、」の部分については、何ら解析が行われていなかった。   However, Patent Documents 1 and 2 and Non-Patent Document 1 described above analyze the top-level structure of the claims, and no structural analysis was performed on the claims having a deeper structure. For example, when the proposed method is used for the following claims, the structural analysis is performed as shown in FIG. 16, and “the duct connected to the outside and the air blowing means for discharging the air” are performed. And a cleaning means for cleaning the air, and no analysis was performed on the portion "."

[請求項]
画像形成装置において、
外部に接続されるダクトと、
エアを排出する送風手段と、
エアを清浄化する清浄化手段と、を備え、
前記ダクトは内部ダクトを有し、
前記清浄化手段は、前記内部ダクト内に設置されている、
ことを特徴とする画像形成装置。
[Claims]
In the image forming apparatus,
A duct connected to the outside;
Air blowing means for discharging air;
A cleaning means for cleaning air,
The duct has an internal duct;
The cleaning means is installed in the internal duct,
An image forming apparatus.

また、前述の特許文献3は、「発明を構成する要素」を抽出し、その説明部分を削除するものであり、特許請求項の構造を解析するものではない。   Further, the above-mentioned Patent Document 3 extracts “elements constituting the invention” and deletes the explanation thereof, and does not analyze the structure of the claims.

本発明は、上記のような状況に応じてなされたものであり、より深い構造を持つ特許請求項についても、構造解析を行うことができる請求項構造情報生成装置等を提供することを目的とする。   The present invention has been made in accordance with the above situation, and an object of the present invention is to provide a claim structure information generation device and the like that can perform structural analysis on a claim having a deeper structure. To do.

上記目的を達成するため、本発明による請求項構造情報生成装置は、特許請求項のテキストが区切られた記述断片と当該記述断片の構造とを示す請求項構造情報を生成する請求項構造情報生成装置であって、特許請求項のテキストである特許請求項情報が記憶される記憶部と、特許請求項情報を形態素解析する形態素解析部と、特許請求項情報の文節の区切位置を特定する文節特定部と、記述断片の区切となると共に記述断片間の関係を示す表層の手がかり情報と、表層の手がかり情報に対応するトークンとを有する表層区切情報が2以上記憶される表層区切情報記憶部と、特許請求項情報において、表層の手かがり情報に該当する位置に、表層の手がかり情報に対応するトークンを付与するトークン付与部と、記述断片の区切となる文節の品詞の手がかり情報と、品詞の手がかり情報に対応する区切文節タイプとを有する文節タイプ対応情報が2以上記憶される文節タイプ対応情報記憶部と、特許請求項情報において、品詞の手がかり情報に該当する文節に、品詞の手がかり情報に対応する区切文節タイプを付与する区切文節タイプ付与部と、特許請求項情報に付与されたトークンと区切文節タイプとを用い、あらかじめ規定されている特許請求項の構造を示す規則に応じて、特許請求項情報の記述断片の構造を示す請求項構造情報を生成する生成部と、生成部が生成した請求項構造情報を出力する出力部と、を備えたものである。   To achieve the above object, a claim structure information generating apparatus according to the present invention generates claim structure information that generates claim structure information indicating a description fragment in which a text of a claim is delimited and a structure of the description fragment. A storage unit for storing claim information that is a text of a claim, a morpheme analysis unit that performs morpheme analysis on the claim information, and a clause that specifies a position where a clause of the claim information is separated A surface layer delimiter information storage unit for storing two or more surface layer delimiter information having a specific part, surface layer clue information indicating delimitation of description fragments and indicating a relationship between the description fragments, and a token corresponding to the surface layer clue information; In the claim information, at a position corresponding to the clue information on the surface layer, a token granting unit that assigns a token corresponding to the clue information on the surface layer, and a clause that delimits the description fragment Corresponding to part-of-speech clue information in the phrase-type correspondence information storage unit for storing at least two clause-type correspondence information having clue information on lyrics and a segmental clause type corresponding to the part-of-speech clue information, and claim information The structure of a claim defined in advance by using a delimiter clause type assigning section for assigning a delimiter clause type corresponding to the clue information of the part of speech to the clause, and a token and a delimiter clause type given to the claim information In accordance with the rules for indicating the claim structure, a generation unit that generates the claim structure information indicating the structure of the description fragment of the claim claim information, and an output unit that outputs the claim structure information generated by the generation unit is there.

このような構成により、表層及び品詞の手がかり情報と特許請求項の構造を示す規則とを用いることによって、特許請求項に含まれる記述断片の構造を検出することができる。また、文節単位で解析を行うことにより、従来例のように形態素ごとに解析を行っていた場合よりもより詳細なレベルで解析を行うことができるようになる。その結果、深い階層の構造をも解析することができるようになる。   With such a configuration, the structure of the description fragment included in the claim can be detected by using the clue information of the surface layer and the part of speech and the rule indicating the structure of the claim. Further, by performing analysis in units of phrases, it becomes possible to perform analysis at a more detailed level than in the case where analysis is performed for each morpheme as in the conventional example. As a result, a deep hierarchical structure can be analyzed.

また、本発明による請求項構造情報生成装置では、記述断片の区切の並びに応じて、記述断片の区切でない位置に存在する区切文節タイプを削除する区切文節タイプ変更部をさらに備え、生成部は、区切文節タイプ変更部が区切文節タイプを削除した後に請求項構造情報を生成してもよい。   The claim structure information generating apparatus according to the present invention further includes a delimiter clause type changing unit that deletes a delimiter clause type existing at a position that is not a delimiter of the description fragment in accordance with the delimiter of the description fragment, and the generation unit includes: Claim structure information may be generated after the delimiter clause type changing unit deletes the delimiter clause type.

このような構成により、記述断片の区切の並びに応じて、区切文節タイプを変更することができ、より適切な構造解析を行うことができるようになる。例えば、表層や品詞の手がかり情報を用いた区切位置の検出のみでは、形式的な区切位置をも検出してしまうことになりうるが、この区切文節タイプ変更部による区切文節タイプの削除を行うことによって、不適切な区切位置を削除することができ、より高精度な解析を実現することができる。   With such a configuration, the delimiter clause type can be changed in accordance with the arrangement of descriptive fragments, and more appropriate structural analysis can be performed. For example, only the detection of the break position using the surface layer and part-of-speech clue information can also detect the formal break position, but this break phrase type change section should delete the break phrase type. Thus, an inappropriate break position can be deleted, and a more accurate analysis can be realized.

また、本発明による請求項構造情報生成装置では、区切文節タイプ変更部は、並列する記述断片の終端の区切文節タイプである終端区切文節タイプと、終端区切文節タイプより以前の、並列する記述断片が継続しうる区切文節タイプである継続区切文節タイプとの間に終端区切文節タイプが存在する場合に、両区切文節タイプの間に存在する終端区切文節タイプを削除してもよい。   In the claim structure information generating device according to the present invention, the delimiter clause type change unit includes a delimiter clause type that is a delimiter clause type at the end of the parallel descriptive fragment, and a description fragment that is in parallel before the terminal delimiter clause type. When there is a terminal delimiter clause type between a delimiter clause type that can be continued, a terminal delimiter clause type existing between both delimiter clause types may be deleted.

このような構成により、一つの記述断片に含まれる小休止的な終端区切文節タイプを削除することができ、区切位置を適切にすることができる。例えば、特許請求項に「……し、……し、……し、……することを特徴とする」という記述や、「……と、……と、……と、……を備え、」という記述が存在した場合に、その「……」の部分に「する」が含まれたとしても、それは「……し、」や「……と、」等の中の小休止的な区切であって、記述断片の区切ではないと考えられるため、その「する」に対応する終端区切文節タイプを削除することになる。   With such a configuration, it is possible to delete a short break terminal delimiter clause type included in one description fragment and to make the delimiter position appropriate. For example, a claim is provided with a description “characterized by ………,…, ………,…”, “…,…,…,…, If there is a description of “”, even if “……” is included in the part of “……”, it is a short break in “……”, “...”, etc. Since it is considered not to be a delimiter of the description fragment, the terminal delimiter clause type corresponding to “Yes” is deleted.

また、本発明による請求項構造情報生成装置では、区切文節タイプ変更部は、改行が存在する場合であって、改行が後続しない動詞に関する区切文節タイプが存在する場合に、区切文節タイプを削除してもよい。
このような構成により、強力な区切である改行が後続しない動詞に関する区切文節タイプを削除することができ、区切位置を適切にすることができる。
In the claim structure information generating device according to the present invention, the delimiter clause type changing unit deletes the delimiter clause type when there is a newline and there is a delimiter clause type related to a verb not followed by a newline. May be.
With such a configuration, it is possible to delete a delimiter clause type related to a verb that is not followed by a new line that is a strong delimiter, and an appropriate delimiter position.

また、本発明による請求項構造情報生成装置では、生成部は、文脈自由文法で記述されたトークン及び区切文節タイプに関する規則と、規則に対応する構造を特許請求項情報に付与するアクションとを有する文法ファイルを用いて生成された構文解析器を用いて、特許請求項情報に対応する請求項構造情報を生成してもよい。   In the claim structure information generation device according to the present invention, the generation unit has rules relating to tokens and delimiter clause types described in a context-free grammar, and an action for assigning a structure corresponding to the rules to the claim information. Claim structure information corresponding to the claim information may be generated using a parser generated using a grammar file.

このような構成により、文法ファイルを用いて生成された構文解析器を用いることによって、トークンや区切文節タイプの付与された特許請求項情報から、特許請求項の構造を解析した請求項構造情報を生成することができる。   With such a configuration, by using a syntax analyzer generated by using a grammar file, the claim structure information obtained by analyzing the structure of the claim from the claim information to which the token or the demarcation clause type is assigned. Can be generated.

また、本発明による請求項構造情報生成装置では、特許請求項の構造の文脈自由文法による記述が特許請求項の終端から先頭への方向で記述されており、生成部は、トークン及び区切文節タイプの付与された特許請求項情報を終端から先頭への方向で取り込むことによって請求項構造情報を生成してもよい。   Further, in the claim structure information generating apparatus according to the present invention, the description in the context free grammar of the structure of the claim is described in the direction from the end to the beginning of the claim, and the generation unit includes the token and delimiter clause type. Claim structure information may be generated by fetching the appended claim information in the direction from the end to the beginning.

特許請求項では、終端に定型的な表現が存在し、その終端から先頭の方向で構造が確定するため、このような構成により、文法のあいまいさに起因する問題の発生を回避することができうる。例えば、shift/reduce conflictや、reduce/reduce conflictといった曖昧性を回避することができる。   In the claims, there is a typical expression at the end, and the structure is determined in the direction from the end to the beginning. Therefore, such a configuration can avoid the occurrence of problems caused by grammatical ambiguity. sell. For example, ambiguities such as shift / reduce conflict and reduce / reduce conflict can be avoided.

また、本発明による請求項構造情報生成装置では、生成部は、特許請求項情報に、文法ファイルに含まれる規則に対応した構造を示すマークを付与することによって、マークアップ言語を用いて記述された請求項構造情報を生成してもよい。
このような構成により、請求項構造情報を、例えば、XMLなどのマークアップ言語を用いて記述することができる。
In the claim structure information generating apparatus according to the present invention, the generating unit is described using a markup language by adding a mark indicating a structure corresponding to a rule included in the grammar file to the claim information. Claim structure information may be generated.
With this configuration, the claim structure information can be described using a markup language such as XML, for example.

また、本発明による請求項構造情報生成装置では、生成部は、あらかじめ規定されているトークンの付与された記述断片及び区切文節タイプの付与された記述断片の係り受け関係に応じて、トークン付与部が付与したトークン及び区切文節タイプ付与部が付与した区切文節タイプで区切の示される記述断片間の係り受け関係を特定し、記述断片間の係り受け関係を示す請求項構造情報を生成してもよい。
このような構成により、トークンや区切文節タイプによって区切位置が示される記述断片の間の係り受け関係を示す請求項構造情報を得ることができる。
Further, in the claim structure information generating apparatus according to the present invention, the generating unit includes a token granting unit according to a dependency relationship between a description fragment to which a predetermined token is assigned and a description fragment to which a delimiter clause type is assigned. Even if the dependency relationship between the description fragments indicated by the delimiter is specified by the token given by the delimiter and the delimiter clause type given by the delimiter clause type assignment unit, the claim structure information indicating the dependency relationship between the description fragments may be generated. Good.
With such a configuration, it is possible to obtain claim structure information indicating a dependency relationship between description fragments whose delimiter positions are indicated by tokens or delimiter clause types.

また、本発明による請求項構造情報生成装置では、出力部は、生成部が生成した請求項構造情報を、記述断片間の関係が分かるように表示してもよい。
このような構成により、その表示された請求項構造情報を見ることによって、特許の専門家でなくても、特許請求項の構造を容易に把握することができるようになる。
In the claim structure information generating apparatus according to the present invention, the output unit may display the claim structure information generated by the generation unit so that the relationship between the description fragments can be understood.
With such a configuration, by viewing the displayed claim structure information, it is possible to easily grasp the structure of a claim even if it is not a patent expert.

また、本発明による請求項構造情報生成装置では、トークンには、構成要素の包含関係に応じたトークンが存在し、区切文節タイプには、構成要素の包含関係を示すトークンに対して、親の構成要素に応じた区切文節タイプである親区切文節タイプと、構成要素の包含関係を示すトークンに対して、子の構成要素に応じた区切文節タイプである子区切文節タイプと、が存在し、出力部は、親区切文節タイプに対応する記述断片と、子区切文節タイプに対応する記述断片との親子関係が分かるように両記述断片を表示してもよい。
このような構成により、特許請求項に含まれる構成要素の親子関係をより明確に示すことができるようになる。
In the claim structure information generating device according to the present invention, the token includes a token corresponding to the inclusion relation of the component, and the delimiter clause type includes a parent of the token indicating the inclusion relation of the component. There are a parent delimiter clause type that is a delimiter clause type according to the component, and a child delimiter clause type that is a delimiter clause type according to the child component for the token indicating the inclusion relationship of the component, The output unit may display both description fragments so that the parent-child relationship between the description fragment corresponding to the parent-delimited clause type and the description fragment corresponding to the child-delimited clause type can be understood.
With such a configuration, the parent-child relationship of the constituent elements included in the claims can be shown more clearly.

また、本発明による請求項構造情報生成装置では、親区切文節タイプと子区切文節タイプとの付与された特許請求項情報を用いて、構成要素の親子関係を取得する親子関係取得部と、親子関係取得部が取得した構成要素の親子関係を用いて、構成要素の階層レベルを取得する階層レベル取得部と、を備え、出力部は、階層レベル取得部が取得した階層レベルに応じて、親区切文節タイプ及び子区切文節タイプに対応する記述断片を表示してもよい。
このような構成により、階層レベルに応じた表示が可能となり、例えば、ある構成要素がどの階層に存在するのかを容易に把握することができるようになる。
Further, in the claim structure information generating device according to the present invention, a parent-child relationship acquisition unit for acquiring a parent-child relationship of the constituent elements using the claim information to which a parent-delimited clause type and a child-delimited clause type are attached, and a parent-child A hierarchy level acquisition unit that acquires the hierarchy level of the component using the parent-child relationship of the component acquired by the relationship acquisition unit, and the output unit includes a parent according to the hierarchy level acquired by the hierarchy level acquisition unit. A description fragment corresponding to the delimiter clause type and the child delimiter clause type may be displayed.
With such a configuration, it is possible to display according to the hierarchy level, and for example, it is possible to easily grasp in which hierarchy a certain component exists.

本発明による請求項構造情報生成装置等によれば、より深い構造を持つ特許請求項についても、構造解析を行うことができる。   According to the claim structure information generating apparatus and the like according to the present invention, it is possible to perform structural analysis even for a claim having a deeper structure.

本発明の実施の形態1による請求項構造情報生成装置の構成を示すブロック図The block diagram which shows the structure of the claim structure information generation apparatus by Embodiment 1 of this invention 同実施の形態による請求項構造情報生成装置の動作を示すフローチャートThe flowchart which shows operation | movement of the claim structure information generation apparatus by the embodiment 同実施の形態における表層区切情報の一例を示す図The figure which shows an example of the surface layer division | segmentation information in the embodiment 同実施の形態における文節タイプ対応情報の一例を示す図The figure which shows an example of the phrase type corresponding | compatible information in the embodiment 同実施の形態における状態遷移表の一例を示す図The figure which shows an example of the state transition table in the embodiment 同実施の形態における状態遷移表の一例を示す図The figure which shows an example of the state transition table in the embodiment 同実施の形態における文法ファイルの一例を示す図The figure which shows an example of the grammar file in the embodiment 同実施の形態における文法ファイルの一例を示す図The figure which shows an example of the grammar file in the embodiment 同実施の形態における文法ファイルの一例を示す図The figure which shows an example of the grammar file in the embodiment 同実施の形態における文法ファイルの一例を示す図The figure which shows an example of the grammar file in the embodiment 同実施の形態における文法ファイルの一例を示す図The figure which shows an example of the grammar file in the embodiment 同実施の形態における文法ファイルの一例を示す図The figure which shows an example of the grammar file in the embodiment 同実施の形態における文法ファイルの一例を示す図The figure which shows an example of the grammar file in the embodiment 同実施の形態における文法ファイルの一例を示す図The figure which shows an example of the grammar file in the embodiment 同実施の形態における文法ファイルの一例を示す図The figure which shows an example of the grammar file in the embodiment 同実施の形態における文法ファイルの一例を示す図The figure which shows an example of the grammar file in the embodiment 同実施の形態における文法ファイルの一例を示す図The figure which shows an example of the grammar file in the embodiment 同実施の形態における文法ファイルの一例を示す図The figure which shows an example of the grammar file in the embodiment 同実施の形態における請求項構造情報の一例を示す図The figure which shows an example of the claim structure information in the embodiment 同実施の形態における請求項構造情報の一例を示す図The figure which shows an example of the claim structure information in the embodiment 同実施の形態における請求項構造情報の表示の一例を示す図The figure which shows an example of the display of the claim structure information in the embodiment 同実施の形態における請求項構造情報の表示の一例を示す図The figure which shows an example of the display of the claim structure information in the embodiment 同実施の形態における請求項構造情報の表示の一例を示す図The figure which shows an example of the display of the claim structure information in the embodiment 同実施の形態による請求項構造情報生成装置の他の構成を示すブロック図The block diagram which shows the other structure of the claim structure information generation apparatus by the embodiment 同実施の形態における構成要素の親子関係の一例を示す図The figure which shows an example of the parent-child relationship of the component in the embodiment 同実施の形態における請求項構造情報の表示の一例を示す図The figure which shows an example of the display of the claim structure information in the embodiment 上記実施の形態におけるコンピュータシステムの外観一例を示す模式図The schematic diagram which shows an example of the external appearance of the computer system in the said embodiment 上記実施の形態におけるコンピュータシステムの構成の一例を示す図The figure which shows an example of a structure of the computer system in the said embodiment. 従来例における特許請求項の解析結果の一例を示す図The figure which shows an example of the analysis result of the claim in the conventional example

以下、本発明による請求項構造情報生成装置について、実施の形態を用いて説明する。なお、以下の実施の形態において、同じ符号を付した構成要素及びステップは同一または相当するものであり、再度の説明を省略することがある。   Hereinafter, a claim structure information generation device according to the present invention will be described using embodiments. In the following embodiments, components and steps denoted by the same reference numerals are the same or equivalent, and repetitive description may be omitted.

(実施の形態1)
本発明の実施の形態1による請求項構造情報生成装置について、図面を参照しながら説明する。本実施の形態による請求項構造情報生成装置は、表層及び品詞の手がかり情報を用いることによって、より深い構造を持つ特許請求項についても、構造解析を行うものである。
(Embodiment 1)
A claim structure information generation device according to Embodiment 1 of the present invention will be described with reference to the drawings. The claim structure information generation device according to the present embodiment performs structural analysis on a claim having a deeper structure by using the clue information of the surface layer and the part of speech.

図1は、本実施の形態による請求項構造情報生成装置1の構成を示すブロック図である。本実施の形態による請求項構造情報生成装置1は、特許請求項のテキストが区切られた記述断片とその記述断片の構造とを示す請求項構造情報を生成するものであって、記憶部11と、形態素解析部12と、文節特定部13と、表層区切情報記憶部14と、トークン付与部15と、文節タイプ対応情報記憶部16と、区切文節タイプ付与部17と、区切文節タイプ変更部18と、生成部19と、出力部20とを備える。なお、記述断片とは、特許請求項において、係り受け関係を解析する単位であり、隣接する複数の文字から構成されるものである。記述断片は、例えば、構成要素を含む文節であってもよく、構成要素に関する説明であってもよく、特許請求項に独特な表現(例えば、構成要素の包含関係を示す表現や、ジェプソン形式であることを示す表現、引用関係を示す表現等)であってもよく、その他のものであってもよい。   FIG. 1 is a block diagram showing a configuration of a claim structure information generating apparatus 1 according to this embodiment. A claim structure information generating apparatus 1 according to the present embodiment generates claim structure information indicating a description fragment in which a text of a claim is delimited and a structure of the description fragment, and includes a storage unit 11 The morphological analysis unit 12, the phrase specifying unit 13, the surface layer delimiter information storage unit 14, the token granting unit 15, the phrase type correspondence information storage unit 16, the delimiter phrase type providing unit 17, and the delimiter phrase type changing unit 18 A generation unit 19 and an output unit 20. The description fragment is a unit for analyzing the dependency relationship in the claims, and is composed of a plurality of adjacent characters. The description fragment may be, for example, a clause including a component, or may be a description related to the component, and may be expressed in a manner unique to a claim (for example, an expression indicating an inclusion relation of a component or a jepson form). It may be an expression indicating a certain thing, an expression indicating a citation relationship, or the like.

記憶部11では、特許請求項のテキストである特許請求項情報が記憶される。その特許請求項情報は、例えば、一の請求項の情報であってもよく、あるいは、複数の請求項の情報であってもよい。後者の場合には、複数の請求項は、従属関係を有するものであってもよく、あるいは、そうでなくてもよい。また、その特許請求項情報は、例えば、特許公報や特許公開公報における[特許請求の範囲]の情報であってもよく、あるいは、そうでなくてもよい。この記憶部11で記憶される特許請求項情報が、構造解析の対象となるものである。   The storage unit 11 stores patent claim information which is a text of a patent claim. The claim information may be information of one claim or information of a plurality of claims, for example. In the latter case, the claims may or may not be dependent. Moreover, the claim information may be, for example, the information of [Claims] in a patent gazette or a patent publication gazette, or may not be so. The claim information stored in the storage unit 11 is an object of structural analysis.

記憶部11に特許請求項情報が記憶される過程は問わない。例えば、記録媒体を介して情報が記憶部11で記憶されるようになってもよく、通信回線等を介して送信された特許請求項情報が記憶部11で記憶されるようになってもよく、あるいは、入力デバイスを介して入力された特許請求項情報が記憶部11で記憶されるようになってもよい。記憶部11での記憶は、RAM等における一時的な記憶でもよく、あるいは、長期的な記憶でもよい。記憶部11は、所定の記録媒体(例えば、半導体メモリや磁気ディスク、光ディスクなど)によって実現されうる。なお、記憶部11において、特許請求項情報以外の情報が記憶されてもよいことは言うまでもない。例えば、後述する各構成要素による処理の結果の情報(具体的には、形態素解析の結果や、付与されたトークン、文節タイプ等)が記憶部11で記憶されてもよい。   The process in which the claim information is stored in the storage unit 11 does not matter. For example, information may be stored in the storage unit 11 via a recording medium, or claim information transmitted via a communication line or the like may be stored in the storage unit 11. Alternatively, the claim information input via the input device may be stored in the storage unit 11. The storage in the storage unit 11 may be temporary storage in a RAM or the like, or may be long-term storage. The storage unit 11 can be realized by a predetermined recording medium (for example, a semiconductor memory, a magnetic disk, an optical disk, etc.). It goes without saying that information other than the claim information may be stored in the storage unit 11. For example, information on the result of processing by each component described later (specifically, the result of morphological analysis, the tokens assigned, the phrase type, etc.) may be stored in the storage unit 11.

形態素解析部12は、記憶部11で記憶されている特許請求項情報を形態素解析する。その形態素解析によって、特許請求項情報のテキストを形態素に分けることができ、また形態素ごとの品詞の情報を得ることができる。その形態素解析のシステムとしては、例えば、京都大学情報学研究科−日本電信電話株式会社コミュニケーション科学基礎研究所共同研究ユニットプロジェクトを通じて開発された「MeCab」や、奈良先端科学技術大学院大学で開発された「ChaSen(茶筌)」(http://chasen.naist.jp)等が知られている。例えば、「MeCab」の場合には、出力フォーマットのパラメータを指定することで、各形態素を1行で表示し、かつ、「見出し」、「品詞文字列」、「活用形」、「見出し(基本形)」、「2階層目の品詞」の5つの情報をタブ区切りで出力させることができる。なお、「MeCab」は1行ごとに解析を行う仕様となっているため、特許請求項情報のテキストにおいて改行が存在する場合には、行ごとに形態素解析を行い、行の区切りを示す品詞文字列(例えば、「NEWLINE」等)を挿入した上で、結果を連結させてもよい。この形態素解析部12による形態素解析の結果は、記憶部11で記憶されてもよく、あるいは、他の図示しない記録媒体で記憶されてもよい。   The morphological analysis unit 12 performs morphological analysis on the claim information stored in the storage unit 11. By the morphological analysis, the text of the claim information can be divided into morphemes, and the part of speech information for each morpheme can be obtained. The morphological analysis system is, for example, “MeCab” developed through the joint research unit project of the Graduate School of Informatics of Kyoto University-Nippon Telegraph and Telephone Corporation, Communication Science Basic Research Laboratories, and the Nara Institute of Science and Technology Graduate University. “ChaSen” (http://chasen.naist.jp) is known. For example, in the case of “MeCab”, by specifying an output format parameter, each morpheme is displayed in one line, and “headline”, “part of speech character string”, “utilization form”, “headline (basic form) ) ”And“ part of speech in the second layer ”can be output separated by tabs. Note that “MeCab” is designed to analyze line by line, so if there is a line break in the text of the claim information, the morphological analysis is performed for each line, and the part of speech character indicating the line break The results may be concatenated after inserting a column (eg, “NEWLINE”, etc.). The result of the morpheme analysis by the morpheme analysis unit 12 may be stored in the storage unit 11 or may be stored in another recording medium (not shown).

文節特定部13は、特許請求項情報の文節の区切位置を特定する。この文節の区切位置を特定する方法は問わない。例えば、形態素解析の結果である形態素を文節単位にまとめ上げることによって、文節の区切位置を特定してもよく、あるいは、手がかり句やその他の情報を用いることによって、特許請求項情報そのものから文節の区切位置を特定してもよい。本実施の形態では、前者の場合について説明する。その前者の場合には、文節特定部13は、例えば、図5で示される状態遷移表と、形態素解析の結果である「品詞文字列」、「活用形」、「2階層目の品詞」とを用いて、形態素を文節にまとめ上げてもよい。例えば、形態素A,Bがこの順番で並んでいた場合に、図5の状態遷移表における形態素Aに対応する「現在」の行と、形態素Bに対応する「次」の列との交わるところの数値が「1」であれば、形態素A,Bの間に文節の区切位置が存在しないことになり(すなわち、形態素A,Bは同じ文節に含まれることになる)、その数値が「0」であれば、形態素A,Bの間に文節の区切位置が存在することになる(すなわち、形態素A,Bは異なる文節に含まれることになる)。この処理をすべての隣接する2個の形態素について行うことによって、文節特定部13は、文節の区切位置を特定することができる。なお、これ以外の方法によって、文節の区切位置の特定を行ってもよいことは言うまでもない。例えば、連続する2個の形態素について、両者が同一の文節に含まれるべきかどうかを記述するルールを列挙し、それを順次適用することで文節まとめ上げをしてもよい。また、文節の区切位置を特定するとは、例えば、文節の区切位置を示す情報(例えば、文節の区切位置に応じた先頭からの文字数や、バイト数等)を記憶部11や図示しない記録媒体に蓄積することであってもよく、形態素間の文節の区切位置に対応する箇所に、区切位置であることを示す情報を挿入することであってもよく、形態素解析の結果である各形態素を、文節単位にまとめ上げることであってもよく、あるいは、文節の区切位置を知ることができるその他の方法であってもよい。また、文節特定部13が文節の区切位置の特定を行うタイミングは、その特定を形態素解析の結果を用いて行う場合には、形態素解析部12による形態素解析の後となる。また、その特定を、後述する表層の手がかり情報に対応するトークンをも用いて行う場合には、文節特定部13は、後述するトークン付与部15によるトークンの付与後に文節の区切位置の特定を行ってもよい。また、その特定を、特許請求項情報そのものから行う場合には、文節特定部13は、形態素解析やトークンの付与と関係のないタイミングで文節の区切位置の特定を行ってもよい。   The phrase specifying unit 13 specifies the segment break position of the claim information. There is no limitation on the method for specifying the break position of this clause. For example, by dividing the morphemes that are the result of morphological analysis into clause units, the segment break position may be specified, or by using clue phrases and other information, the clause information can be identified from the claim information itself. A delimiter position may be specified. In the present embodiment, the former case will be described. In the former case, the phrase specifying unit 13 includes, for example, the state transition table shown in FIG. 5 and “part-of-speech character string”, “utilization form”, and “part-of-speech part 2” as the result of morphological analysis. Using, morphemes may be grouped into phrases. For example, when the morphemes A and B are arranged in this order, the “current” row corresponding to the morpheme A and the “next” column corresponding to the morpheme B in the state transition table of FIG. If the numerical value is “1”, there is no clause segmentation position between morphemes A and B (that is, morphemes A and B are included in the same clause), and the numerical value is “0”. If so, there will be a clause break position between morphemes A and B (that is, morphemes A and B will be included in different clauses). By performing this process for all two adjacent morphemes, the phrase specifying unit 13 can specify the segment break position. Needless to say, the phrase break position may be specified by other methods. For example, for two consecutive morphemes, rules describing whether or not both should be included in the same phrase may be listed, and the phrases may be collected by sequentially applying the rules. The phrase delimiter position is specified by, for example, storing information indicating the delimiter position of the phrase (for example, the number of characters from the head or the number of bytes according to the phrase delimiter position) in the storage unit 11 or a recording medium (not shown). It may be to accumulate, may be to insert information indicating the delimiter position at the location corresponding to the delimiter position of the clause between morphemes, each morpheme that is the result of the morpheme analysis, It may be grouped into phrase units, or may be other methods that can know the segment break position. In addition, the timing at which the phrase specifying unit 13 specifies the segment break position is after the morpheme analysis by the morpheme analysis unit 12 when the specification is performed using the result of the morpheme analysis. In addition, when the identification is performed using a token corresponding to the clue information on the surface layer described later, the phrase specifying unit 13 specifies the segment break position after the token granting unit 15 described later gives the token. May be. Further, when the identification is performed from the claim information itself, the phrase identification unit 13 may identify the segment break position at a timing unrelated to morphological analysis or token assignment.

表層区切情報記憶部14では、2以上の表層区切情報が記憶される。ここで、表層区切情報は、記述断片の区切となると共に記述断片間の関係を示す表層の手がかり情報と、その表層の手がかり情報に対応するトークンとを有する情報である。表層とは、文字列そのものの意味である。前述のMeCabの説明における「見出し」が表層である。表層の手がかり情報は、いわゆる手がかり句のことである。その表層の手がかり情報は、通常、正規表現を用いて記述される。トークンは、その表層の手がかり情報を識別する情報である。   The surface layer delimiter information storage unit 14 stores two or more surface layer delimiter information. Here, the surface layer delimiter information is information including surface layer clue information indicating demarcation of the description fragments and indicating the relationship between the description fragments, and a token corresponding to the surface layer clue information. The surface layer means the character string itself. The “heading” in the above description of MeCab is the surface layer. Surface clue information is a so-called clue phrase. The surface layer clue information is usually described using a regular expression. The token is information for identifying clue information on the surface layer.

その表層の手がかり情報には、例えば、ジェプソン形式の記載(例えば、「において、」等)に応じたものが存在してもよく、特徴記載(例えば、「を特徴とする、」等)に応じたものが存在してもよく、構成要素の包含関係の記載(例えば、「を備えた」「を備えており、」等)に応じたものが存在してもよく、引用関係の記載(例えば、「請求項…に」等)に応じたものが存在してもよい。また、それらの表層の手がかり情報に対応して、ジェプソン形式のトークンや、特徴記載のトークン、構成要素の包含関係のトークン、引用関係のトークン等が存在してもよい。この表層の手がかり情報は、記述断片の区切となるものである。すなわち、表層の手がかり情報に該当する位置の直前及び/または直後が、通常、記述断片の区切位置となる。また、表層の手がかり情報によって、記述断片の間の関係が検出されることになる。すなわち、表層の手がかり情報は、その表層の手がかり情報を用いることによって記述断片間の関係を検出できる、という意味において、記述断片間の関係を示すものである。その記述断片間の関係は、例えば、記述断片の係り受けの関係であり、その係り受けの詳細については後述する。   The surface layer clue information may include, for example, information according to a Jepson format description (for example, “in”), or according to a characteristic description (for example, “characterizes”, etc.). May be present, or may be in accordance with the description of the inclusion relationship (for example, “has”, “has,” etc.) of the constituent elements, and the description of the citation relationship (for example, , “According to“ claim ”, etc.)) may exist. Corresponding to the surface layer clue information, there may be a Jepson token, a feature description token, a component inclusion token, a citation token, or the like. This clue information on the surface layer serves as a delimiter for description fragments. That is, the position immediately before and / or immediately after the position corresponding to the clue information on the surface layer is usually the delimiter position of the description fragment. Further, the relationship between the description fragments is detected based on the clue information on the surface layer. That is, the clue information on the surface layer indicates the relationship between the description fragments in the sense that the relationship between the description fragments can be detected by using the clue information on the surface layer. The relationship between the description fragments is, for example, a dependency relationship of description fragments, and details of the dependency will be described later.

表層区切情報記憶部14に2以上の表層区切情報が記憶される過程は問わない。例えば、記録媒体を介して2以上の表層区切情報が表層区切情報記憶部14で記憶されるようになってもよく、通信回線等を介して送信された2以上の表層区切情報が表層区切情報記憶部14で記憶されるようになってもよく、あるいは、入力デバイスを介して入力された2以上の表層区切情報が表層区切情報記憶部14で記憶されるようになってもよい。表層区切情報記憶部14での記憶は、RAM等における一時的な記憶でもよく、あるいは、長期的な記憶でもよい。表層区切情報記憶部14は、所定の記録媒体(例えば、半導体メモリや磁気ディスク、光ディスクなど)によって実現されうる。   The process in which two or more surface layer division | segmentation information is memorize | stored in the surface layer division | segmentation information storage part 14 does not ask | require. For example, two or more surface layer delimiter information may be stored in the surface layer delimiter information storage unit 14 via a recording medium, and two or more surface layer delimiter information transmitted via a communication line or the like may be stored in the surface layer delimiter information. It may be stored in the storage unit 14, or two or more surface layer delimiter information input via the input device may be stored in the surface layer delimiter information storage unit 14. The storage in the surface layer delimiter information storage unit 14 may be temporary storage in a RAM or the like, or may be long-term storage. The surface layer delimiter information storage unit 14 can be realized by a predetermined recording medium (for example, a semiconductor memory, a magnetic disk, an optical disk, or the like).

また、表層区切情報に含まれる各情報、例えば、表層の手がかり情報やトークンは、それらの情報そのものであってもよく、あるいは、それらの情報を特定可能な情報であってもよい。後者の場合には、表層区切情報に含まれる表層の手がかり情報等は、例えば、表層の手がかり情報等が格納されている領域を示すポインタやアドレスであってもよい。このことは、他の情報についても同様であるとする。   In addition, each information included in the surface layer delimiter information, for example, surface layer clue information and tokens, may be the information itself, or may be information that can identify the information. In the latter case, the surface layer clue information and the like included in the surface layer separation information may be, for example, a pointer or an address indicating an area in which the surface layer clue information or the like is stored. This is the same for other information.

トークン付与部15は、特許請求項情報において、表層の手かがり情報に該当する位置に、その表層の手がかり情報に対応するトークンを付与する。トークンを付与するとは、特許請求項情報において、結果としてトークンに対応する位置を特定することができるのであれば、その手法は問わない。トークン付与部15は、例えば、特許請求項情報の文字列そのものに対して、トークンを追記してもよく、あるいは、トークンと、そのトークンに対応する特許請求項情報の範囲とを対応付ける情報を記憶部11や他の図示しない記録媒体に蓄積してもよい。本実施の形態では、前者の場合について説明する。トークン付与部15は、例えば、表層区切情報に含まれる表層の手がかり情報を検索キーとして特許請求項情報を検索し、ヒットした箇所に、その表層の手がかり情報に対応するトークンを付与してもよい。トークン付与部15は、そのような処理を、表層区切情報に含まれるすべての表層の手がかり情報について行ってもよい。なお、第1の表層の手がかり情報(例えば、「ことを特徴とする」)が、第2の表層の手がかり情報(例えば、「を特徴とする」)を含む場合には、トークン付与部15は、例えば、第1の表層の手がかり情報から先に検索を行ってトークンを付与し、トークンの付与されている箇所は、それ以降の検索時に検索を行わないようにしてもよい。または、トークン付与部15は、例えば、第2の表層の手がかり情報から先に検索を行ってトークンを付与し、第1の表層の手がかり情報を用いた検索を行う際に、すでにトークンの付与されている箇所についても検索を行って、すでにトークンの付与されている箇所がヒットした際には、上書きでトークンを付与してもよい。   In the claim information, the token granting unit 15 grants a token corresponding to the surface clue information to a position corresponding to the surface clue information. The method of granting a token is not limited as long as the position corresponding to the token can be identified as a result in the claim information. For example, the token granting unit 15 may add a token to the character string itself of the claim information, or store information associating the token with the range of the claim information corresponding to the token. It may be stored in the unit 11 or other recording medium (not shown). In the present embodiment, the former case will be described. For example, the token granting unit 15 may search the patent claim information using the surface clue information included in the surface layer delimiter information as a search key, and may give a token corresponding to the surface clue information to the hit location. . The token granting unit 15 may perform such processing for all the surface layer clue information included in the surface layer separation information. If the first surface clue information (for example, “characteristically”) includes the second surface clue information (for example, “characteristically”), the token granting unit 15 For example, the token may be assigned by searching first from the clue information on the first surface layer, and the portion to which the token is assigned may not be searched during subsequent searches. Alternatively, for example, the token granting unit 15 gives a token by performing a search first from the clue information on the second surface layer, and when the search is performed using the clue information on the first surface layer, the token is already assigned. A search may also be performed for a spot where a token has already been assigned, and a token may be assigned by overwriting when a hit has already been made.

文節タイプ対応情報記憶部16では、2以上の文節タイプ対応情報が記憶される。ここで、文節タイプ対応情報は、記述断片の区切となる文節の品詞の手がかり情報と、その品詞の手がかり情報に対応する区切文節タイプとを有する情報である。品詞の手がかり情報は、表層の手がかり句の品詞版と言いうるものである。すなわち、品詞の手がかり情報は、品詞に関する条件を少なくとも含む手がかり情報である。品詞の手がかり情報は、品詞のみを特定する情報であってもよく、品詞と活用形とを特定する情報であってもよく、品詞や、品詞と活用形以外に、表層の情報をも特定する情報であってもよく、その他の品詞に関係する情報であってもよい。なお、品詞の手がかり情報には、記述断片の区切とは関係のない文節の品詞の手がかり情報が存在してもよい。その場合には、そのような区切と関係のない文節の品詞の手がかり情報に対応する文節のタイプと、区切文節タイプとを含めて、単に文節タイプと呼ぶことにする。すなわち、文節タイプには、その文節が記述断片の区切となる区切文節タイプと、区切とは関係のないものとが存在することになる。   The phrase type correspondence information storage unit 16 stores two or more phrase type correspondence information. Here, the phrase type correspondence information is information having clue information on the part of speech of the clause that is a delimiter of the description fragment and a break phrase type corresponding to the clue information on the part of speech. The part-of-speech clue information can be said to be a part-of-speech version of a surface layer clue phrase. That is, the part-of-speech clue information is clue information including at least a condition related to the part-of-speech. The part-of-speech clue information may be information that identifies only the part of speech, or information that identifies the part of speech and the inflected form. In addition to the part of speech or the part of speech and inflected form, the surface information is also identified. It may be information, or information related to other parts of speech. The part-of-speech clue information may include part-of-speech part-of-speech information that is not related to the segmentation of the description fragment. In that case, the phrase type corresponding to the part-of-speech clue information of the phrase unrelated to such a break and the break phrase type are simply referred to as a phrase type. That is, the clause type includes a delimiter clause type in which the clause serves as a delimiter for description fragments, and a clause type unrelated to the delimiter.

その品詞の手がかり情報には、例えば、並列する記述断片の終端の区切文節タイプ(以下、これを「終端区切文節タイプ」と呼ぶこともある)に応じたもの(例えば、「動詞や助動詞の終止形」等)が存在してもよく、並列する記述断片が継続しうる(すなわち、終端とは言えない)区切文節タイプ(以下、これを「継続区切文節タイプ」と呼ぶこともある)に応じたもの(例えば、「動詞や助動詞の連用形」「名詞+と」等)が存在してもよい。また、その他の品詞の手かがり情報が存在してもよい。   The part-of-speech clue information includes, for example, information corresponding to the delimiter clause type at the end of parallel description fragments (hereinafter also referred to as “terminal delimiter clause type”) (for example, “end of verb or auxiliary verb”) Depending on the delimiter clause type (hereinafter sometimes referred to as the “continue delimiter clause type”) in which parallel description fragments can continue (that is, cannot be said to be terminal). May be present (for example, “verb or auxiliary verb continuous form”, “noun + and”, etc.). Further, other part-of-speech cue information may exist.

文節タイプ対応情報記憶部16に2以上の文節タイプ対応情報が記憶される過程は問わない。例えば、記録媒体を介して2以上の文節タイプ対応情報が文節タイプ対応情報記憶部16で記憶されるようになってもよく、通信回線等を介して送信された2以上の文節タイプ対応情報が文節タイプ対応情報記憶部16で記憶されるようになってもよく、あるいは、入力デバイスを介して入力された2以上の文節タイプ対応情報が文節タイプ対応情報記憶部16で記憶されるようになってもよい。文節タイプ対応情報記憶部16での記憶は、RAM等における一時的な記憶でもよく、あるいは、長期的な記憶でもよい。文節タイプ対応情報記憶部16は、所定の記録媒体(例えば、半導体メモリや磁気ディスク、光ディスクなど)によって実現されうる。   The process in which two or more phrase type correspondence information is stored in the phrase type correspondence information storage unit 16 does not matter. For example, two or more phrase type correspondence information may be stored in the phrase type correspondence information storage unit 16 via a recording medium, and two or more phrase type correspondence information transmitted via a communication line or the like may be stored. The phrase type correspondence information storage unit 16 may store the phrase type correspondence information, or two or more phrase type correspondence information input via the input device may be stored in the phrase type correspondence information storage unit 16. May be. Storage in the phrase type correspondence information storage unit 16 may be temporary storage in a RAM or the like, or may be long-term storage. The phrase type correspondence information storage unit 16 can be realized by a predetermined recording medium (for example, a semiconductor memory, a magnetic disk, an optical disk, or the like).

区切文節タイプ付与部17は、特許請求項情報において、品詞の手がかり情報に該当する文節に、品詞の手がかり情報に対応する区切文節タイプを付与する。区切文節タイプ付与部17は、区切文節タイプではない文節タイプを付与してもよい。また、区切文節タイプ付与部17は、形態素解析部12による形態素解析の結果を用いて、この付与の処理を行うものとする。文節タイプの付与は、前述したトークンの付与と同様に、特許請求項情報において、結果として文節タイプに対応する位置を特定することができるのであれば、その手法は問わない。例えば、特許請求項情報の文字列そのものに対して、文節タイプを追記してもよく、あるいは、文節タイプと、その文節タイプに対応する特許請求項情報の範囲とを対応付ける情報を記憶部11や他の図示しない記録媒体に蓄積してもよい。本実施の形態では、前者の場合について説明する。区切文節タイプ付与部17は、例えば、文節タイプ対応情報に含まれる品詞の手がかり情報を検索キーとして形態素解析の結果を検索し、ヒットした箇所に、その品詞の手がかり情報に対応する文節タイプを付与してもよい。区切文節タイプ付与部17は、そのような処理を、文節タイプ対応情報に含まれるすべての品詞の手がかり情報について行ってもよい。なお、第1の品詞の手がかり情報が、第2の品詞の手がかり情報を含む場合には、トークンの付与の場合と同様に、例えば、第1の品詞の手がかり情報から先に文節タイプの付与を行い、すでに文節タイプの付与されている箇所は、それ以降の文節タイプの付与を行わないようにしてもよく、または、第2の品詞の手がかり情報から先に文節タイプの付与を行い、第1の品詞の手がかり情報を用いた文節タイプの付与を行う際に、すでに文節タイプの付与されている箇所については、上書きで文節タイプを付与してもよい。この区切文節タイプ付与部17による文節タイプの付与の結果、一の文節に一の文節タイプが付与されることになる。なお、文節タイプの付与されない文節が存在してもよい。また、今後の説明において、文節タイプAの付与された文節のことを、単にAと呼ぶこともある。   The demarcation phrase type assigning unit 17 assigns a demarcation phrase type corresponding to the part-of-speech clue information to the phrase corresponding to the part-of-speech clue information in the claim information. The delimited phrase type assigning unit 17 may assign a phrase type that is not a delimited phrase type. In addition, the demarcation phrase type assigning unit 17 performs the assigning process using the result of the morpheme analysis by the morpheme analyzing unit 12. The granting of the phrase type is not limited as long as the position corresponding to the phrase type can be identified as a result in the claim information, as in the token grant described above. For example, the clause type may be added to the character string itself of the claim information, or information that associates the clause type with the scope of the claim information corresponding to the clause type is stored in the storage unit 11 or You may accumulate | store in another recording medium which is not illustrated. In the present embodiment, the former case will be described. For example, the delimited phrase type assigning unit 17 searches the result of the morphological analysis using the clue information of the part of speech included in the phrase type correspondence information as a search key, and assigns the phrase type corresponding to the clue information of the part of speech to the hit location. May be. The delimited phrase type assigning unit 17 may perform such processing for clue information of all parts of speech included in the phrase type correspondence information. When the first part-of-speech clue information includes the second part-of-speech clue information, for example, the phrase type is given first from the first part-of-speech clue information, as in the case of token grant. The phrase type may be added to the part where the phrase type has already been assigned, or the phrase type may be assigned first from the clue information of the second part of speech. When the phrase type is assigned using the part-of-speech clue information, the phrase type may be assigned by overwriting the part where the phrase type has already been assigned. As a result of the provision of the phrase type by the delimiter phrase type assignment unit 17, one phrase type is assigned to one phrase. There may be clauses to which no clause type is assigned. In the following description, the phrase to which the phrase type A is given may be simply referred to as A.

区切文節タイプ変更部18は、記述断片の区切の並びに応じて、記述断片の区切でない位置に存在する区切文節タイプを削除する。「記述断片の区切の並びに応じて」とは、特許請求項情報に付与されたトークンや区切文節タイプの並びに応じて、ということである。すなわち、付与されたトークンや区切文節タイプの並びが所定の条件を満たした場合に、区切文節タイプ変更部18は、その条件を満たした並びにおける特定の区切文節タイプを削除する。具体的には、区切文節タイプ変更部18は、終端区切文節タイプと、その終端区切文節タイプより以前の(すなわち、それよりも先頭に近い位置に存在する)継続区切文節タイプとの間に終端区切文節タイプが存在する場合に、その終端区切文節タイプと継続区切文節タイプとの間に存在する終端区切文節タイプを削除してもよい。また、区切文節タイプ変更部18は、改行が存在する場合であって、改行が後続しない、動詞に関する区切文節タイプ(この区切文節タイプは、例えば、動詞に関する終端区切文節タイプであってもよく、動詞に関する継続区切文節タイプであってもよい)が存在する場合に、その区切文節タイプを削除してもよい。なお、「改行が後続しない」区切文節タイプとは、その区切文節タイプの付与された文節の直後に改行が存在しない区切文節タイプのことである。また、「動詞に関する区切文節タイプ」とは、動詞または助動詞に関する品詞の手がかり情報に対応する区切文節タイプのことである。また、区切文節タイプ変更部18は、注目している範囲内において、その処理を行ってもよい。例えば、区切文節タイプ変更部18は、ジェプソン形式のトークンの付与されている位置よりも先頭に近い部分(この部分を「前半部」と呼ぶこともある)について、この処理を行い、また、ジェプソン形式のトークンの付与されている位置よりも終端に近い部分(この部分を「後半部」と呼ぶこともある)について、この処理を行ってもよい。また、例えば、区切文節タイプ変更部18は、一つの請求項の全体に対してこの処理を行ってもよい。また、区切文節タイプ変更部18は、区切文節タイプの削除以外に、文節タイプの付け替え(変更)を行ってもよい。区切文節タイプ変更部18は、区切文節タイプではない文節タイプを、区切文節タイプに変更してもよく、あるいは、区切文節タイプを区切文節タイプではない文節タイプに変更してもよい。後者は、区切文節タイプがなくなるという意味において、区切文節タイプの削除であると言うこともできる。   The delimiter clause type changing unit 18 deletes delimiter clause types that exist at positions that are not delimiters of description fragments, in accordance with the delimitation of description fragments. “According to the arrangement of descriptive fragments” refers to the arrangement of tokens and delimiter clause types assigned to the claim information. That is, when the sequence of the given tokens or delimiter clause types satisfies a predetermined condition, the delimiter clause type change unit 18 deletes a specific delimiter clause type in the sequence that satisfies the condition. Specifically, the delimiter clause type changing unit 18 terminates between the end delimiter clause type and a continuation delimiter clause type that is earlier than the end delimiter clause type (that is, located at a position closer to the head). If there is a delimiter clause type, the terminal delimiter clause type existing between the terminal delimiter clause type and the continuation delimiter clause type may be deleted. Further, the delimiter clause type changing unit 18 is a delimiter clause type related to a verb in which a newline is present and no newline follows (this delimiter clause type may be a terminal delimiter clause type related to a verb, for example, If there is a continuation break clause type for a verb), the break clause type may be deleted. The delimiter clause type that “no line feed follows” is a delimiter clause type that does not have a line break immediately after the clause to which the delimiter clause type is assigned. The “delimiter clause type related to a verb” is a delimiter clause type corresponding to clue information of a part of speech related to a verb or auxiliary verb. Moreover, the demarcation phrase type changing unit 18 may perform the processing within a range of interest. For example, the delimiter clause type changing unit 18 performs this process on a portion closer to the head than the position where the Jepson token is given (this portion may be referred to as the “first half”). This processing may be performed for a portion closer to the end than the position where the format token is assigned (this portion may be referred to as “second half portion”). Further, for example, the demarcation clause type changing unit 18 may perform this process for the entire claim. In addition, the delimiter clause type changing unit 18 may change (change) the phrase type in addition to deleting the delimiter clause type. The delimiter clause type changing unit 18 may change a clause type that is not a delimiter clause type to a delimiter clause type, or may change a delimiter clause type to a clause type that is not a delimiter clause type. The latter can be said to be a deletion of the delimiter clause type in the sense that the delimiter clause type is eliminated.

また、区切文節タイプ変更部18は、トークンや文節タイプの並びに応じて、区切文節タイプではない文節タイプを区切文節タイプに変更してもよい。この場合には、新たな区切文節タイプが生成されることになる。例えば、区切文節タイプ変更部18は、改行が存在する場合であって、改行が後続する、動詞に関する文節タイプ(この文節タイプは区切文節タイプではないものとする)が存在する場合に、その文節タイプを区切文節タイプに変更してもよい。また、例えば、区切文節タイプ変更部18は、構成要素の包含関係のトークンの直前の名詞に関する文節タイプ(この文節タイプは区切文節タイプではないものとする)が存在する場合に、その文節タイプを区切文節タイプに変更してもよい。名詞に関する文節タイプとは、名詞に関する品詞の手がかり情報に対応する文節タイプのことである。また、区切文節タイプ変更部18による文節タイプの変更には、後述する生成部19において、構文解析器を用いた解析が行われる場合に、その解析に合致する記述とするための変更が含まれてもよい。   Further, the delimiter clause type changing unit 18 may change a clause type that is not a delimiter clause type to a delimiter clause type in accordance with the arrangement of tokens and clause types. In this case, a new delimiter clause type is generated. For example, the delimiter clause type change unit 18 has a new line, and when there is a phrase type related to a verb followed by a new line (this phrase type is not a delimited phrase type), the phrase The type may be changed to a delimited clause type. Also, for example, when there is a phrase type related to a noun immediately before the token of the inclusion relation of the component (assuming that this phrase type is not a separator phrase type), the delimiter phrase type changing unit 18 changes the phrase type. You may change to a delimited clause type. The phrase type related to the noun is a phrase type corresponding to the clue information of the part of speech related to the noun. In addition, the phrase type change by the delimiter phrase type changing unit 18 includes a change to make the description match the analysis when the generation unit 19 described later performs an analysis using a syntax analyzer. May be.

ここで、トークンの付与と、文節タイプの付与、及び文節タイプの変更について簡単に説明する。特許請求項情報にトークンや文節タイプが付与されることによって、特許請求項情報における記述断片の区切位置を特定することができるようになる。トークンは、表層の手がかり句を用いて付与されるものであり、文節タイプは、品詞に関する条件を用いて付与されるものである。また、文節タイプが変更されることによって、その区切位置がより適切なものとなることになる。なお、本実施の形態による請求項構造情報生成装置1では、文節を単位として記述断片の区切位置を検出するため、従来例のように形態素を単位として記述断片の区切位置の検出を行う場合よりも、より詳細な構造に関するルールを設定することができる。従来例の場合には、文節よりも細かい形態素を単位としていたため、より詳細な構造に関するルールを設定しようとした場合に、そのルールが非常に細かいものとなってしまい、実質的にルールを作り上げることができなかった。一方、本実施の形態による請求項構造情報生成装置1では、文節を単位としているため、より詳細な構造に関するルールを妥当な範囲で設定することができ、より詳細な構造に関する解析が可能となった。   Here, a brief description will be given of token assignment, clause type assignment, and clause type change. By adding a token or clause type to the claim information, it becomes possible to specify the delimiter position of the description fragment in the claim information. The token is given using a cue phrase on the surface layer, and the phrase type is given using a condition related to the part of speech. In addition, when the phrase type is changed, the delimiter position becomes more appropriate. Since the claim structure information generating apparatus 1 according to the present embodiment detects the delimiter position of the description fragment in units of clauses, the delimiter position of the descriptive fragment is detected in units of morphemes as in the conventional example. Even more detailed rules regarding the structure can be set. In the case of the conventional example, since the unit is a morpheme finer than a clause, when trying to set a rule related to a more detailed structure, the rule becomes very fine, and the rule is substantially created. I couldn't. On the other hand, since the claim structure information generating apparatus 1 according to the present embodiment uses clauses as a unit, it is possible to set rules related to a more detailed structure within a reasonable range, and to analyze a more detailed structure. It was.

生成部19は、特許請求項情報に付与されたトークンと区切文節タイプとを用い、あらかじめ規定されている特許請求項の構造を示す規則に応じて、特許請求項情報の記述断片の構造を示す請求項構造情報を生成する。なお、区切文節タイプ変更部18による区切文節タイプの削除や文節タイプの変更が行われた場合には、生成部19は、区切文節タイプ変更部18が区切文節タイプを削除したり、文節タイプを変更したりした後に、請求項構造情報を生成する。すなわち、その削除や変更の行われた後の、特許請求項情報に付与されたトークンと区切文節タイプとを用いて、生成部19は、請求項構造情報を生成する。請求項構造情報は、記述断片の区切と、その記述断片の属性とを少なくとも示す情報である。記述断片の属性とは、例えば、記述断片が構成要素名を含むことを示すものであってもよく、記述断片が、構成要素名を含む記述断片に対する説明であることを示すものであってもよく、記述断片がジェプソン形式の記載であることを示すものであってもよく、記述断片が構成要素の包含関係の記載であることを示すものであってもよく、記述断片間の係り受け関係を示すものであってもよい。生成部19は、特許請求項情報に付与されたトークンや区切文節タイプの種類に応じて、記述断片の区切位置を特定することができる。例えば、トークンや区切文節タイプと、そのトークンや区切文節タイプに対応する区切位置とを有する情報を用いて、生成部19は、記述断片の区切位置を特定できる。また、生成部19は、特許請求項情報に付与されたトークンや区切文節タイプそのもの、あるいは、それらの並びに応じて、記述断片の属性を特定することができる。例えば、トークンや区切文節タイプと、そのトークンや区切文節タイプに対応する属性とを有する情報を用いて、生成部19は、記述断片の属性を特定できる。また、例えば、トークンや区切文節タイプの並びを示す情報と、そのトークンや区切文節タイプに対応する属性とを有する情報を用いて、生成部19は、記述断片の属性を特定できる。   The generation unit 19 indicates the structure of the description fragment of the claim information in accordance with the rule indicating the structure of the patent claim, which is specified in advance, using the token and the delimiter clause type given to the claim information. Claim structure information is generated. When the delimiter clause type change unit 18 deletes the delimiter clause type or changes the phrase type, the generation unit 19 deletes the delimiter clause type or the phrase type is changed by the delimiter clause type change unit 18. After the change, the claim structure information is generated. That is, the generation unit 19 generates the claim structure information using the token and the delimiter clause type given to the claim information after the deletion or change. The claim structure information is information indicating at least a description fragment delimiter and an attribute of the description fragment. The attribute of the description fragment may indicate, for example, that the description fragment includes the component name, or may indicate that the description fragment is an explanation for the description fragment including the component name. Well, it may indicate that the description fragment is a description in the Jepson format, may indicate that the description fragment is a description of the inclusion relation of the constituent elements, and the dependency relationship between the description fragments. May be shown. The generation unit 19 can specify the delimitation position of the description fragment according to the type of token or delimiter clause type given to the claim information. For example, the generation unit 19 can specify the delimitation position of the description fragment using information including a token or delimiter clause type and a delimiter position corresponding to the token or delimiter clause type. In addition, the generation unit 19 can specify the attribute of the description fragment according to the token or the demarcation clause type itself given to the claim information or the arrangement thereof. For example, the generation unit 19 can specify the attribute of the description fragment by using information including a token or a delimiter clause type and an attribute corresponding to the token or delimiter clause type. For example, the generation unit 19 can specify the attribute of the description fragment by using information including information indicating a sequence of tokens and delimiter clause types and attributes corresponding to the token and delimiter clause types.

生成部19は、例えば、構文解析器を用いて、トークン及び区切文節タイプの付与された特許請求項情報に対応する請求項構造情報を生成してもよい。その構文解析器(パーサ)は、文脈自由文法で記述されたトークン及び区切文節タイプに関する規則と、規則に対応する構造を特許請求項情報に付与するアクションとを有する文法ファイルを用いて生成されたものである。すなわち、その構文解析器によって、トークン及び区切文節タイプの付与された特許請求項情報を解析することによって、請求項構造情報が得られる。この場合には、生成部19は、あらかじめ規定されている特許請求項の構造を示す規則である文法ファイルに応じて、請求項構造情報を生成することになる。生成部19は、その特許請求項情報に、文法ファイルに含まれる規則に対応した構造を示すマーク(例えば、タグなど)を付与することによって、マークアップ言語を用いて記述された請求項構造情報を生成してもよい。その規則は、例えば、トークンや区切文節タイプの並びに関する規則であってもよい。また、アクションは、記述断片の属性に応じたものであってもよい。マークアップ言語は、例えば、XML(Extensible Markup Language)であってもよく、その他のものであってもよい。そのXMLの構造としては、谷川英和らが提案しているPML(Patent Markup Language)を使用してもよい(http://www.ird−pat.com/pml.html)。また、その構文解析器を用いて請求項構造情報を生成する際に、生成部19は、トークン及び区切文節タイプの付与された特許請求項情報を終端から先頭への方向で取り込むことによって請求項構造情報を生成してもよい。特許請求項では、終端に定型的な表現が存在し、その終端から先頭の方向で構造が確定するため、このような構成により、文法のあいまいさに起因する問題の発生を回避することができうる。例えば、shift/reduce conflictや、reduce/reduce conflictといった曖昧性を回避することができる。なお、この場合には、特許請求項の構造の文脈自由文法による記述が特許請求項の終端から先頭への方向で記述されているものとする。   The generation unit 19 may generate the claim structure information corresponding to the claim information to which the token and the demarcation clause type are given, for example, using a syntax analyzer. The parser (parser) was generated using a grammar file having rules for token and delimiter clause types described in a context-free grammar, and an action for assigning a structure corresponding to the rules to claim information. Is. That is, the claim structure information is obtained by analyzing the claim information to which the token and the demarcation clause type are given by the parser. In this case, the generation unit 19 generates the claim structure information in accordance with a grammar file that is a rule indicating the structure of a patent claim defined in advance. The generating unit 19 attaches a mark (for example, a tag) indicating a structure corresponding to a rule included in the grammar file to the claim information, and claims structure information described using a markup language May be generated. The rule may be, for example, a rule related to a sequence of tokens and delimited clause types. The action may be in accordance with the attribute of the description fragment. The markup language may be, for example, XML (Extensible Markup Language) or any other. As the XML structure, PML (Patent Markup Language) proposed by Hidekazu Tanigawa et al. May be used (http://www.ird-pat.com/pml.html). Further, when generating the claim structure information using the parser, the generation unit 19 reads the claim information to which the token and the delimiter clause type are added in the direction from the end to the start. Structural information may be generated. In the claims, there is a typical expression at the end, and the structure is determined in the direction from the end to the beginning. Therefore, such a configuration can avoid the occurrence of problems caused by grammatical ambiguity. sell. For example, ambiguities such as shift / reduce conflict and reduce / reduce conflict can be avoided. In this case, it is assumed that the description in the context-free grammar of the structure of the claim is described in the direction from the end to the beginning of the claim.

また、生成部19は、例えば、あらかじめ規定されているトークンの付与された記述断片及び区切文節タイプの付与された記述断片の係り受け関係に応じて、トークン付与部15が付与したトークン及び区切文節タイプ付与部17が付与した区切文節タイプで区切の示される記述断片間の係り受け関係を特定し、記述断片間の係り受け関係を示す請求項構造情報を生成してもよい。この場合には、あらかじめ規定されているトークンの付与された記述断片及び区切文節タイプの付与された記述断片の係り受け関係が、あらかじめ規定されている特許請求項の構造を示す規則である。あらかじめ規定されているトークンの付与された記述断片及び区切文節タイプの付与された記述断片の係り受け関係には、例えば、トークンの付与された記述断片同士の係り受け関係が含まれてもよく、区切文節タイプの付与された記述断片同士の係り受け関係が含まれてもよく、トークンの付与された記述断片と区切文節タイプの付与された記述断片との間の係り受け関係が含まれてもよい。例えば、区切文節タイプAの付与された記述断片は、トークンBの付与された記述断片に係ることがあらかじめ規定されている場合には、生成部19は、区切文節タイプAの付与された記述断片が、トークンBの付与された記述断片に係る、という係り受け関係を示す請求項構造情報を生成してもよい。その請求項構造情報は、例えば、記述断片と、その記述断片が係る記述断片を識別する情報とを対応付けた情報であってもよい。   In addition, the generation unit 19, for example, determines the token and delimiter clause given by the token grant unit 15 according to the dependency relationship between the description fragment to which the predetermined token is given and the descriptive clause to which the descriptive clause type is given. The dependency structure between the description fragments indicated by the delimiter clause type provided by the type assigning unit 17 may be specified, and the claim structure information indicating the dependency relationship between the description fragments may be generated. In this case, the dependency relationship between the description fragment to which the token is specified in advance and the description fragment to which the delimiter clause type is assigned is a rule indicating the structure of the claimed claim. The dependency relationship between the description fragment to which the token is assigned and the description fragment to which the delimiter clause type is assigned may include, for example, the dependency relationship between the description fragments to which the token is attached, It may include a dependency relationship between descriptive fragments with a delimited clause type, or include a dependency relationship between a descriptive fragment with a token and a descriptive clause type. Good. For example, when it is preliminarily specified that the description fragment to which the delimiter clause type A is assigned relates to the description fragment to which the token B is given, the generation unit 19 describes the description fragment to which the delimiter clause type A is assigned. May generate claim structure information indicating a dependency relationship relating to the description fragment to which the token B is assigned. The claim structure information may be, for example, information in which a description fragment is associated with information for identifying the description fragment related to the description fragment.

出力部20は、生成部19が生成した請求項構造情報を出力する。ここで、この出力は、例えば、表示デバイス(例えば、CRTや液晶ディスプレイなど)への表示でもよく、所定の機器への通信回線を介した送信でもよく、プリンタによる印刷でもよく、記録媒体への蓄積でもよく、他の構成要素への引き渡しでもよい。その出力が表示である場合に、出力部20は、生成部19が生成した請求項構造情報を、記述断片間の関係が分かるように表示してもよい。例えば、請求項構造情報が、記述断片間の係り受け関係を示すものである場合には、出力部20は、記述断片と、その記述断片間の係り受けに対応する図形とを表示してもよい。その係り受けに対応する図形は、例えば、係り受け関係のある2個の記述断片をつなぐ線の図形であってもよく、係り受け関係のある2個の記述断片の双方に付与された同じマークの図形であってもよく、その他の係り受け関係を示す図形であってもよい。また、例えば、請求項構造情報が、記述断片の区切と、その記述断片の属性とを少なくとも示す情報である場合には、出力部20は、あらかじめ規定されている属性の係り受け関係に応じて、記述断片間の係り受け関係が分かるように表示してもよい。その表示は、例えば、前述のように、記述断片と、その記述断片間の係り受けに対応する図形とを表示するものであってもよい。   The output unit 20 outputs the claim structure information generated by the generation unit 19. Here, the output may be, for example, display on a display device (for example, a CRT or a liquid crystal display), transmission via a communication line to a predetermined device, printing by a printer, or output to a recording medium. It may be accumulated or delivered to another component. When the output is a display, the output unit 20 may display the claim structure information generated by the generation unit 19 so that the relationship between the description fragments can be understood. For example, when the claim structure information indicates the dependency relationship between the description fragments, the output unit 20 may display the description fragment and the graphic corresponding to the dependency between the description fragments. Good. The figure corresponding to the dependency may be, for example, a line figure connecting two description fragments having a dependency relationship, and the same mark given to both of the two description fragments having a dependency relationship. The figure may also be a figure showing other dependency relationships. Further, for example, when the claim structure information is information indicating at least a description fragment delimiter and an attribute of the description fragment, the output unit 20 responds to a predetermined dependency relationship of attributes. , It may be displayed so that the dependency relationship between the description fragments can be understood. The display may display, for example, a description fragment and a graphic corresponding to the dependency between the description fragments as described above.

なお、出力部20は、出力を行うデバイス(例えば、表示デバイスやプリンタなど)を含んでもよく、あるいは含まなくてもよい。また、出力部20は、ハードウェアによって実現されてもよく、あるいは、それらのデバイスを駆動するドライバ等のソフトウェアによって実現されてもよい。   The output unit 20 may or may not include an output device (for example, a display device or a printer). The output unit 20 may be realized by hardware, or may be realized by software such as a driver that drives these devices.

なお、記憶部11と、表層区切情報記憶部14と、文節タイプ対応情報記憶部16との任意の2以上の記憶部は、同一の記録媒体によって実現されてもよく、あるいは、別々の記録媒体で実現されてもよい。前者の場合には、例えば、特許請求項情報を記憶している領域が記憶部11となり、表層区切情報を記憶している領域が表層区切情報記憶部14となる。   Note that any two or more storage units of the storage unit 11, the surface layer delimiter information storage unit 14, and the phrase type correspondence information storage unit 16 may be realized by the same recording medium, or may be separate recording media. It may be realized with. In the former case, for example, the area storing the claim information becomes the storage unit 11, and the area storing the surface layer delimiter information becomes the surface layer delimiter information storage unit 14.

次に、本実施の形態による請求項構造情報生成装置1の動作について、図2のフローチャートを用いて説明する。なお、このフローチャートにおいて、形態素解析やトークンの付与等の行われた特許請求項情報が、すべて記憶部11で記憶される場合について説明する。   Next, operation | movement of the claim structure information generation apparatus 1 by this Embodiment is demonstrated using the flowchart of FIG. Note that, in this flowchart, a description will be given of a case where all the claims information subjected to morphological analysis, token assignment, and the like are stored in the storage unit 11.

(ステップS101)形態素解析部12は、記憶部11で記憶されている特許請求項情報を形態素解析する。そして、形態素解析部12は、その結果を記憶部11に蓄積する。その形態素解析の結果は、例えば、一つの形態素の情報が一行となるテキストファイルであってもよい。   (Step S <b> 101) The morpheme analysis unit 12 performs morpheme analysis on the claim information stored in the storage unit 11. Then, the morphological analysis unit 12 accumulates the result in the storage unit 11. The result of the morphological analysis may be, for example, a text file in which information on one morpheme is on a single line.

(ステップS102)トークン付与部15は、記憶部11で記憶されている特許請求項情報に対して、表層区切情報記憶部14で記憶されている表層区切情報を用いて、トークンの付与を行う。付与されたトークンは、記憶部11において、特許請求項情報の該当箇所に対応付けられて記憶されるものとする。トークンは、例えば、形態素解析の結果のテキストファイルにおいて、表層の手がかり情報に該当する箇所と同じ行に追記されてもよい。なお、表層の手がかり情報に該当する箇所が複数の形態素にまたがる場合には、トークン付与部15は、例えば、その複数の形態素を一つにまとめてもよい。   (Step S <b> 102) The token grant unit 15 grants a token to the claim information stored in the storage unit 11 using the surface layer delimiter information stored in the surface layer delimiter information storage unit 14. The given token is stored in the storage unit 11 in association with the corresponding part of the claim information. For example, the token may be added to the same line as the portion corresponding to the clue information on the surface layer in the text file as a result of the morphological analysis. In addition, when the location corresponding to the clue information on the surface layer extends over a plurality of morphemes, the token granting unit 15 may combine the plurality of morphemes into one, for example.

(ステップS103)文節特定部13は、記憶部11で記憶されている形態素解析後の各形態素をまとめ上げることによって、文節の区切を特定する。文節特定部13は、例えば、特定した文節の区切位置である形態素の間に、文節の区切位置であることを示す情報を追記してもよい。   (Step S <b> 103) The phrase specifying unit 13 specifies phrase breaks by collecting the morphemes after morpheme analysis stored in the storage unit 11. The phrase specifying unit 13 may, for example, add information indicating that the phrase is at a phrase break position between morphemes that are the phrase break positions specified.

(ステップS104)区切文節タイプ付与部17は、記憶部11で記憶されている特許請求項情報の文節に対して、文節タイプ対応情報記憶部16で記憶されている文節タイプ対応情報を用いて、文節タイプを付与する。その付与する文節タイプには、区切文節タイプが含まれていることは前述の通りである。付与された文節タイプは、記憶部11において、特許請求項情報の該当する文節に対応付けられて記憶されるものとする。文節タイプは、例えば、文節の区切位置の特定後のテキストファイルにおいて、品詞の手がかり情報に該当する箇所と同じ行に追記されてもよい。なお、一つの文節が複数の形態素から構成されている場合には、区切文節タイプ付与部17は、例えば、この文節タイプの付与後に、文節ごとに一行となるように、その複数の形態素をまとめてもよい。   (Step S104) The demarcation phrase type giving unit 17 uses the phrase type correspondence information stored in the phrase type correspondence information storage unit 16 for the clause of the claim information stored in the storage unit 11, and Give clause type. As described above, the phrase type to be added includes the delimiter phrase type. The assigned phrase type is stored in the storage unit 11 in association with the corresponding phrase of the claim information. For example, the phrase type may be added to the same line as the part corresponding to the part-of-speech clue information in the text file after specifying the segment break position. When one clause is composed of a plurality of morphemes, for example, the delimiter clause type assigning unit 17 summarizes the plurality of morphemes so that one clause is provided for each clause after the clause type is assigned. May be.

(ステップS105)区切文節タイプ変更部18は、付与された文節タイプを、トークンや文節タイプの並びに応じて変更する。その変更には、記述断片の区切でない位置に存在する区切文節タイプを削除することが含まれることは、前述の通りである。また、区切文節タイプ変更部18は、前述のように、区切文節タイプでない文節タイプを区切文節タイプに変更してもよく、その他の文節タイプの変更を行ってもよい。   (Step S105) The delimited phrase type changing unit 18 changes the assigned phrase type according to the sequence of tokens and phrase types. As described above, the change includes deleting a delimiter clause type that exists at a position that is not a delimiter of the description fragment. Further, as described above, the delimiter clause type changing unit 18 may change a clause type that is not a delimiter clause type to a delimiter clause type, or may change other clause types.

(ステップS106)生成部19は、トークンや文節タイプの付与された特許請求項情報から、請求項構造情報を生成する。   (Step S106) The generation unit 19 generates claim structure information from the claim information to which the token or clause type is assigned.

(ステップS107)出力部20は、生成部19が生成した請求項構造情報を出力する。そして、請求項構造情報を生成し、出力する一連の処理が終了となる。   (Step S107) The output unit 20 outputs the claim structure information generated by the generation unit 19. Then, a series of processes for generating and outputting the claim structure information is completed.

なお、特許請求項情報に複数の請求項が含まれる場合には、図2のフローチャートにおいて、ステップS101〜S107の処理を、請求項ごとに繰り返して実行してもよく、あるいは、複数の請求項の全体に対して、ステップS101〜S107の処理を行ってもよい。また、文節の区切位置の特定において付与されたトークンを用いない場合には、トークンの付与の処理を行うタイミングは、文節タイプの変更の処理(ステップS105)よりも以前であればいつでもよい。   In addition, when a plurality of claims are included in the claim information, the processing of steps S101 to S107 may be repeatedly executed for each claim in the flowchart of FIG. 2, or a plurality of claims. You may perform the process of step S101-S107 with respect to the whole. In addition, when the token given in specifying the segment break position is not used, the token granting process may be performed at any time before the phrase type change process (step S105).

次に、本実施の形態による請求項構造情報生成装置1の動作について、具体例を用いて説明する。この具体例では、一の請求項に関する処理について説明するが、特許請求項情報に複数の請求項が含まれていた場合には、その処理を繰り返して実行することによって、複数の請求項についても、解析を行うことができる。また、ここでも、従来例の説明と同様に、次の特許請求項情報が記憶部11で記憶されているものとする。   Next, operation | movement of the claim structure information generation apparatus 1 by this Embodiment is demonstrated using a specific example. In this specific example, a process related to one claim will be described. However, when a plurality of claims are included in the claim information, a plurality of claims can be obtained by repeatedly executing the process. Analysis can be performed. Also here, as in the description of the conventional example, it is assumed that the following claim information is stored in the storage unit 11.

[特許請求項情報]
画像形成装置において、
外部に接続されるダクトと、
エアを排出する送風手段と、
エアを清浄化する清浄化手段と、を備え、
前記ダクトは内部ダクトを有し、
前記清浄化手段は、前記内部ダクト内に設置されている、
ことを特徴とする画像形成装置。
[Claim Information]
In the image forming apparatus,
A duct connected to the outside;
Air blowing means for discharging air;
A cleaning means for cleaning air,
The duct has an internal duct;
The cleaning means is installed in the internal duct,
An image forming apparatus.

また、この具体例において、表層区切情報記憶部14では、図3で示される6種類の表層区切情報が記憶されているものとする。なお、図3における表層の手がかり情報の表現、及びこれ以降の説明において、Perl言語の正規表現の表記を用いている。なお、そのPerl言語については、次の文献を参照されたい。
文献:Larry Wall,Tom Christiansen,Randal L.Shcwartz、「プログラミングPerl 改訂版」、オライリージャパン、1997年
Further, in this specific example, it is assumed that the surface layer delimiter information storage unit 14 stores six types of surface layer delimiter information shown in FIG. In addition, in the expression of the clue information on the surface layer in FIG. 3 and the subsequent description, the regular expression notation of Perl language is used. For the Perl language, refer to the following document.
Literature: Larry Wall, Tom Christiansen, Randal L. Shwartz, "Programming Perl Revised Edition", O'Reilly Japan, 1997

図3の表層区切情報の表層の手がかり情報において、複数行で記述している手がかり情報は、いずれか一つに該当した場合に、対応するトークンを付与することを意味している。トークン「JEPSON_CUE」は、ジェプソン形式の特許請求項に特徴的な手がかり句に対応するものである。トークン「FEATURE_CUE」、「FEATURE_K_CUE」は、特許請求項で使用される特徴記載の手がかり句に対応するものである。トークン「COMPOSE_K_CUE」は、「〜と、〜と、〜とを備えた○○」という構成要素列挙型の特許請求項で使われる手がかり句に対応するものであり、トークン「COMPOSE_R_CUE」は、「〜と、〜と、〜とを備え、〜し、〜し、〜する○○」という変形構成要素列挙型の特許請求項で使われる手がかり句に対応するものである。トークン「QUOTE_CUE」は、特許請求項の従属関係を示す記載の手がかり句に対応するものである。   In the surface layer clue information of the surface layer delimiter information in FIG. 3, the clue information described in a plurality of lines means that a corresponding token is given when any one of them corresponds. The token “JEPSON_CUE” corresponds to the clue phrase characteristic of the Jepson-type claim. The tokens “FEATURE_CUE” and “FEATURE_K_CUE” correspond to the cue phrase described in the claims. The token “COMPOSE_K_CUE” corresponds to the clue phrase used in the claim of the component enumeration type “XX with ˜, ˜, and ˜”, and the token “COMPOSE_R_CUE” , And, and corresponds to the clue phrase used in the claim of the modified component enumeration type of “. The token “QUIOTE_CUE” corresponds to the clue phrase described in the claims.

また、この具体例において、文節タイプ対応情報記憶部16では、図4で示される文節タイプ対応情報が記憶されているものとする。なお、図4の品詞の手がかり情報において、「X」は、名詞または記号である。記号は、句読点を含むものである。また、「Y」は、「体言接続特殊2」の動詞、または接頭詞である。また、図4の文節タイプ対応情報の品詞の手がかり情報において、複数行で記述している手がかり情報は、いずれか一つに該当した場合に、対応する文節タイプを付与することを意味している。例えば、動詞もしくは助動詞の連用形で終わる文節、または、動詞もしくは助動詞の基本形と、それに続く助詞「と共に」もしくは「とともに」で終わる文節には、文節タイプ「VPR」が付与されることを示している。また、図4の文節タイプには、区切文節タイプと、そうでないものとの両方が含まれるが、VPR_P,VPK_P,NPT_Pが、記述断片の区切を示す区切文節タイプである。また、VPK_Pは、終端区切文節タイプであり、VPR_P,NPT_Pは、継続区切文節タイプである。   In this specific example, it is assumed that the phrase type correspondence information storage unit 16 stores the phrase type correspondence information shown in FIG. In the part-of-speech clue information in FIG. 4, “X” is a noun or a symbol. Symbols include punctuation marks. “Y” is a verb or prefix of “body connection special 2”. Also, in the part-of-speech clue information of the phrase type correspondence information in FIG. 4, when the clue information described in a plurality of lines corresponds to any one, it means that the corresponding phrase type is given. . For example, a phrase type “VPR” is given to a clause that ends with a verb or auxiliary verb, or a basic form of a verb or auxiliary verb followed by a phrase that ends with “with” or “with” . In addition, the phrase types in FIG. 4 include both delimited phrase types and non-delimited phrase types, but VPR_P, VPK_P, and NPT_P are delimited phrase types indicating delimiters of description fragments. VPK_P is a terminal delimiter clause type, and VPR_P and NPT_P are continuation delimiter clause types.

まず、形態素解析部12は、記憶部11で記憶されている特許請求項情報に対して、行ごとに形態素解析を行い(すなわち、7回形態素解析を行うことになる)、行区切りの位置に「NEWLINE」を挿入した(ステップS101)。ここでは、形態素解析システム「MeCab」を用いた。その結果は、次の通りである。なお、形態素解析部12による形態素解析の結果は、記憶部11で記憶されることになる。次の結果において、前述のように、形態素ごとに、「見出し(表層)」、「品詞文字列」、「活用形」、「見出し(基本形)」、「2階層目の品詞」の5つの情報が得られる。   First, the morpheme analysis unit 12 performs morpheme analysis for each line of the claim information stored in the storage unit 11 (that is, the morpheme analysis is performed seven times), and at the position of the line break “NEWLINE” was inserted (step S101). Here, the morphological analysis system “MeCab” was used. The results are as follows. Note that the result of the morphological analysis by the morphological analysis unit 12 is stored in the storage unit 11. In the following results, as described above, for each morpheme, five pieces of information of “heading (surface layer)”, “part of speech character string”, “utilization form”, “heading (basic form)”, and “part of speech in the second layer” Is obtained.

[形態素解析の結果]
画像 名詞 画像 一般
形成 名詞 形成 サ変接続
装置 名詞 装置 サ変接続
において 助詞 において 格助詞
、 記号 、 読点
NEWLINE
外部 名詞 外部 一般
に 助詞 に 格助詞
接続 名詞 接続 サ変接続
さ 動詞 未然レル接続 する 自立
れる 動詞 基本形 れる 接尾
ダクト 名詞 ダクト 一般
と 助詞 と 並立助詞
、 記号 、 読点
NEWLINE
エア 名詞 エア 一般
を 助詞 を 格助詞
排出 名詞 排出 サ変接続
する 動詞 基本形 する 自立
送風 名詞 送風 サ変接続
手段 名詞 手段 一般
と 助詞 と 並立助詞
、 記号 、 読点
NEWLINE
エア 名詞 エア 一般
を 助詞 を 格助詞
清浄 名詞 清浄 サ変接続
化 名詞 化 接尾
する 動詞 基本形 する 自立
清浄 名詞 清浄 サ変接続
化 名詞 化 接尾
手段 名詞 手段 一般
と 助詞 と 並立助詞
、 記号 、 読点
を 助詞 を 格助詞
備え 動詞 連用形 備える 自立
、 記号 、 読点
NEWLINE
前記 名詞 前記 サ変接続
ダクト 名詞 ダクト 一般
は 助詞 は 係助詞
内部 名詞 内部 一般
ダクト 名詞 ダクト 一般
を 助詞 を 格助詞
有し 動詞 連用形 有す 自立
、 記号 、 読点
NEWLINE
前記 名詞 前記 サ変接続
清浄 名詞 清浄 サ変接続
化 名詞 化 接尾
手段 名詞 手段 一般
は 助詞 は 係助詞
、 記号 、 読点
前記 名詞 前記 サ変接続
内部 名詞 内部 一般
ダクト 名詞 ダクト 一般
内 名詞 内 接尾
に 助詞 に 格助詞
設置 名詞 設置 サ変接続
さ 動詞 未然レル接続 する 自立
れ 動詞 連用形 れる 接尾
て 助詞 て 接続助詞
いる 動詞 基本形 いる 非自立
、 記号 、 読点
NEWLINE
こと 名詞 こと 非自立
を 助詞 を 格助詞
特徴 名詞 特徴 一般
と 助詞 と 格助詞
する 動詞 基本形 する 自立
画像 名詞 画像 一般
形成 名詞 形成 サ変接続
装置 名詞 装置 サ変接続
。 記号 。 句点
[Results of morphological analysis]
Image noun image general formation noun formation sa change connection device noun device in sa change connection particle in case particle, symbol, punctuation NEWLINE
External noun external in general case particle connected to case particle connected noun connected saber connected verb connected to self-relative self-standing verb basic formed suffix duct noun duct general and particle and parallel particle, symbol, punctuation NEWLINE
Air noun air in general particle in case particle discharge noun discharge insanely connected verb basic form self-sustained noun blast insane connecting means noun means general and particle and parallel particle, symbol, punctuation NEWLINE
Air noun air general particle as case particle cleansing noun purifier saber conjunctive nounization suffix verb basic form self-standing clean noun purifier savariant conjunctive nounization suffix means noun means general and particles and parallel particles, symbols and punctuation as particles Prepared Verb Consistent Provided Independence, Symbols, Readings NEWLINE
The above-mentioned nouns The above-mentioned change connection ducts Nouns Ducts General particles are co-inners Internal nouns Internal general ducts Nouns Ducts General particles have case particles Verbs Conjunctive forms Independence, Symbols, Readings NEWLINE
The above noun The above change connection cleanup Noun Clean The change connection Nounization Suffixing means Noun Meaning Generally, the particle is the particle, symbol, punctuation The above noun The inside change of the internal connection Noun Internal duct Noun Duct General internal noun In the suffix Noun Installation Sabari Connected Verb Naturally Connect Freestanding Verb Conjunctive Form Suffix Particles Conjunctive Verb Verbs Basic Forms Non Independent, Symbols, Readings NEWLINE
That noun that is independence particle is a case particle feature Noun feature General and particle and case particle Verb Basic form Autonomous image Noun image General formation Noun formation Change connection device Noun device Change connection. Sign. Punctuation

次に、トークン付与部15は、表層区切情報記憶部14で記憶されている図3で示される表層区切情報を用いて、形態素解析の結果に対して、トークンを付与する(ステップS102)。具体的には、トークン付与部15は、表層の手がかり情報を検索キーとして形態素解析の結果における見出し(表層)における検索を行い、ヒットしたところに、その表層の手がかり情報に対応するトークンを付与する。なお、トークンの付与の対象が2以上の形態素である場合には、その2以上の形態素を一つの集合(チャンク)として、それにトークンを付与する。また、トークン付与部15が付与したトークンも、記憶部11で記憶されることになる。この場合には、トークン「JEPSON_CUE」、「COMPOSE_R_CUE」、「FEATURE_K_CUE」が付与されている。   Next, the token granting unit 15 grants a token to the result of the morphological analysis using the surface layer delimiter information shown in FIG. 3 stored in the surface layer delimiter information storage unit 14 (step S102). Specifically, the token assigning unit 15 performs a search in the heading (surface layer) in the result of morphological analysis using the surface clue information as a search key, and assigns a token corresponding to the surface clue information to the hit. . If the token is to be assigned to two or more morphemes, the tokens are given to the two or more morphemes as one set (chunk). Further, the token granted by the token granting unit 15 is also stored in the storage unit 11. In this case, tokens “JEPSON_CUE”, “COMPOSE_R_CUE”, and “FEATURE_K_CUE” are given.

[トークンの付与の結果]
画像 名詞 画像 一般
形成 名詞 形成 サ変接続
装置 名詞 装置 サ変接続
において、 JEPSON_CUE
NEWLINE
外部 名詞 外部 一般
に 助詞 に 格助詞
接続 名詞 接続 サ変接続
さ 動詞 未然レル接続 する 自立
れる 動詞 基本形 れる 接尾
ダクト 名詞 ダクト 一般
と 助詞 と 並立助詞
、 記号 、 読点
NEWLINE
エア 名詞 エア 一般
を 助詞 を 格助詞
排出 名詞 排出 サ変接続
する 動詞 基本形 する 自立
送風 名詞 送風 サ変接続
手段 名詞 手段 一般
と 助詞 と 並立助詞
、 記号 、 読点
NEWLINE
エア 名詞 エア 一般
を 助詞 を 格助詞
清浄 名詞 清浄 サ変接続
化 名詞 化 接尾
する 動詞 基本形 する 自立
清浄 名詞 清浄 サ変接続
化 名詞 化 接尾
手段 名詞 手段 一般
と 助詞 と 並立助詞
、 記号 、 読点
を備え、 COMPOSE_R_CUE
NEWLINE
前記 名詞 前記 サ変接続
ダクト 名詞 ダクト 一般
は 助詞 は 係助詞
内部 名詞 内部 一般
ダクト 名詞 ダクト 一般
を有し、 COMPOSE_R_CUE
NEWLINE
前記 名詞 前記 サ変接続
清浄 名詞 清浄 サ変接続
化 名詞 化 接尾
手段 名詞 手段 一般
は 助詞 は 係助詞
、 記号 、 読点
前記 名詞 前記 サ変接続
内部 名詞 内部 一般
ダクト 名詞 ダクト 一般
内 名詞 内 接尾
に 助詞 に 格助詞
設置 名詞 設置 サ変接続
さ 動詞 未然レル接続 する 自立
れ 動詞 連用形 れる 接尾
て 助詞 て 接続助詞
いる 動詞 基本形 いる 非自立
、 記号 、 読点
ことを特徴とする FEATURE_K_CUE
画像 名詞 画像 一般
形成 名詞 形成 サ変接続
装置 名詞 装置 サ変接続
。 記号 。 句点
[Result of token grant]
Image noun image general formation noun formation change connection device noun device change connection, JEPSON_CUE
NEWLINE
External noun external in general case particle connected to case particle connected noun connected saber connected verb connected to self-relative self-standing verb basic formed suffix duct noun duct general and particle and parallel particle, symbol, punctuation NEWLINE
Air noun air in general particle in case particle discharge noun discharge insanely connected verb basic form self-sustained noun blast insane connecting means noun means general and particle and parallel particle, symbol, punctuation NEWLINE
Air noun Air in general particle as case particle cleanup noun purifier saber conjunctive nounization suffix verb basic form self-standing clean noun purifier savariant conjunctive nounization suffix means noun means in general, particle, parallel particle, symbol, punctuation, COMPOSE_R_CUE
NEWLINE
Said noun said sagittal connection duct noun duct general particle is a particle inner noun internal general duct noun duct general, COMPOSE_R_CUE
NEWLINE
The above noun The above change connection cleanup Noun Clean The change connection Nounization Suffixing means Noun Meaning Generally, the particle is the particle, symbol, punctuation The above noun The inside change of the internal connection Noun Internal duct Noun Duct General internal noun In the suffix Noun installation Sabari connected Verb naturally connected to self-supporting verb Consecutive form Suffix particle and connected particle are verb Basic form is non-independent, symbolic and punctuation mark FEATURE_K_CUE
Image noun image general formation noun formation change connection device noun device change connection. Sign. Punctuation

その後、文節特定部13は、各形態素の「品詞文字列」、「活用形」、「2階層目の品詞」の情報と、図示しない記録媒体で記憶されている図5A,図5Bで示される状態遷移表を用いて、文節の区切位置を特定する(ステップS103)。なお、その際に、文節特定部13は、トークンの付与されている箇所については、その文節の区切位置の特定を行わないものとする。したがって、トークンの付与された箇所、及びそれに隣接する箇所については、文法上の文節の区切とは異なる場合もありうる。なお、この具体例では、文節特定部13は、文節の区切位置の直前の形態素に対して、区切の前であることを示す情報を付与するものとする。文節特定部13による文節の区切位置の特定の結果は、次の通りである。その結果において、文節の区切位置の直前の形態素には、区切の前であることを示す情報「◎」が付与されている。また、文節特定部13が特定した文節の区切位置を示す情報も、記憶部11で記憶されることになる。   Thereafter, the phrase specifying unit 13 is shown in FIG. 5A and FIG. 5B that are stored in a recording medium (not shown) and information of “part of speech character string”, “utilized form”, and “second part of speech” of each morpheme. Using the state transition table, the segment break position is specified (step S103). At that time, the phrase specifying unit 13 does not specify the position where the token is delimited for the part to which the token is given. Therefore, the part where the token is given and the part adjacent to it may be different from the division of the grammatical clause. In this specific example, it is assumed that the phrase specifying unit 13 gives information indicating that it is before the break to the morpheme immediately before the break position of the phrase. The specific result of the phrase delimiter position by the phrase specifying unit 13 is as follows. As a result, the information “」 ”indicating that the morpheme is immediately before the break position is assigned to the morpheme immediately before the break position of the phrase. In addition, information indicating the break position of the phrase specified by the phrase specifying unit 13 is also stored in the storage unit 11.

[文節の区切位置の特定結果]
画像 名詞 画像 一般
形成 名詞 形成 サ変接続
装置 名詞 装置 サ変接続 ◎
において、 JEPSON_CUE ◎
NEWLINE
外部 名詞 外部 一般
に 助詞 に 格助詞 ◎
接続 名詞 接続 サ変接続
さ 動詞 未然レル接続 する 自立
れる 動詞 基本形 れる 接尾 ◎
ダクト 名詞 ダクト 一般
と 助詞 と 並立助詞
、 記号 、 読点 ◎
NEWLINE
エア 名詞 エア 一般
を 助詞 を 格助詞 ◎
排出 名詞 排出 サ変接続
する 動詞 基本形 する 自立 ◎
送風 名詞 送風 サ変接続
手段 名詞 手段 一般
と 助詞 と 並立助詞
、 記号 、 読点 ◎
NEWLINE
エア 名詞 エア 一般
を 助詞 を 格助詞 ◎
清浄 名詞 清浄 サ変接続
化 名詞 化 接尾 ◎
する 動詞 基本形 する 自立 ◎
清浄 名詞 清浄 サ変接続
化 名詞 化 接尾
手段 名詞 手段 一般
と 助詞 と 並立助詞
、 記号 、 読点 ◎
を備え、 COMPOSE_R_CUE ◎
NEWLINE
前記 名詞 前記 サ変接続
ダクト 名詞 ダクト 一般
は 助詞 は 係助詞 ◎
内部 名詞 内部 一般
ダクト 名詞 ダクト 一般 ◎
を有し、 COMPOSE_R_CUE ◎
NEWLINE
前記 名詞 前記 サ変接続
清浄 名詞 清浄 サ変接続
化 名詞 化 接尾
手段 名詞 手段 一般
は 助詞 は 係助詞
、 記号 、 読点 ◎
前記 名詞 前記 サ変接続
内部 名詞 内部 一般
ダクト 名詞 ダクト 一般
内 名詞 内 接尾
に 助詞 に 格助詞 ◎
設置 名詞 設置 サ変接続
さ 動詞 未然レル接続 する 自立
れ 動詞 連用形 れる 接尾
て 助詞 て 接続助詞
いる 動詞 基本形 いる 非自立
、 記号 、 読点 ◎
ことを特徴とする FEATURE_K_CUE ◎
画像 名詞 画像 一般
形成 名詞 形成 サ変接続
装置 名詞 装置 サ変接続
。 記号 。 句点 ◎
[Result of specifying the position of clause break]
Image noun image general formation noun formation change connection device noun device change connection ◎
In JEPSON_CUE ◎
NEWLINE
External noun External In general particle to case particle ◎
Connected Noun Connected Versatile Connected Verb Connected to Self-standing Verb Basic Formed Suffix ◎
Duct Noun Duct General and particle and parallel particle, symbol, reading ◎
NEWLINE
Air noun air general particle as case particle ◎
Ejected noun Ejected Verb Connected verb Basic form Independent ◎
Blowing noun Blowing change connection means Noun means General and particle and parallel particle, symbol, reading ◎
NEWLINE
Air noun air general particle as case particle ◎
Clean Noun Cleanliness Change Connection Nounization Suffix ◎
To verb basic form to independence ◎
Cleansing noun cleansing change connection nounization suffix means noun means general and particle and parallel particle, symbol, reading ◎
COMPOSE_R_CUE ◎
NEWLINE
The above-mentioned noun The above-mentioned variable connection duct Noun duct In general, the particle is the particle ◎
Internal Noun Internal General Duct Noun Duct General ◎
COMPOSE_R_CUE ◎
NEWLINE
The above nouns The above change connection cleanup Nouns Clean up change connection Nounization Suffixing means Noun means In general, the particle is a particle, symbol, punctuation mark ◎
The above nouns The above-mentioned internal connection inside nouns Internal general ducts Nouns Ducts General internal nouns Internal suffixes to particles and case particles ◎
Installation noun installation change verb connected to self-relative self-supporting verb conjunctive form suffixed particle connected verbal verb verb basic form non-independent, symbol, punctuation mark ◎
FEATURE_K_CUE ◎
Image noun image general formation noun formation change connection device noun device change connection. Sign. Punctuation ◎

次に、区切文節タイプ付与部17は、文節タイプ対応情報記憶部16で記憶されている図4で示される文節タイプ対応情報を用いて、文節の区切位置の特定結果に対して、文節タイプを付与する(ステップS104)。その際に、区切文節タイプ付与部17は、文節の末尾の形態素から1個以上の形態素を用いて、文節タイプの付与を行う。具体的には、区切文節タイプ付与部17は、品詞の手がかり情報に該当する文節を検索し、ヒットした文節に対して、その品詞の手がかり情報に対応する文節タイプを付与する。なお、この文節タイプの付与の後は、形態素解析の結果を用いないため、形態素解析の結果のうち、見出し(表層)以外の情報を消去してもよい。また、この文節タイプの付与の結果も、記憶部11で記憶されることになる。この場合には、文節タイプ「NP」や「PP」、「VPK」等が付与されている。   Next, using the phrase type correspondence information shown in FIG. 4 stored in the phrase type correspondence information storage unit 16, the break phrase type assigning unit 17 selects a phrase type for the result of specifying the phrase break position. (Step S104). At that time, the delimited phrase type assigning unit 17 assigns the phrase type using one or more morphemes from the morpheme at the end of the phrase. Specifically, the delimited phrase type assigning unit 17 searches for a phrase corresponding to the part-of-speech clue information, and assigns the phrase type corresponding to the part-of-speech clue information to the hit phrase. Since the result of the morphological analysis is not used after the phrase type is given, information other than the heading (surface layer) may be deleted from the result of the morphological analysis. The result of the phrase type assignment is also stored in the storage unit 11. In this case, the phrase types “NP”, “PP”, “VPK”, and the like are given.

[文節タイプの付与の結果]
画像形成装置 NP
において、 JEPSON_CUE
NEWLINE
外部に PP
接続される VPK
ダクトと、 NPT_P
NEWLINE
エアを NPO
排出する VPK
送風手段と、 NPT_P
NEWLINE
エアを NPO
清浄化 NP
する VPK
清浄化手段と、 NPT_P
を備え、 COMPOSE_R_CUE
NEWLINE
前記ダクトは PP
内部ダクト NP
を有し、 COMPOSE_R_CUE
NEWLINE
前記清浄化手段は、 PP
前記内部ダクト内に PP
設置されている、 VPK_P
ことを特徴とする FEATURE_K_CUE
画像形成装置。 NP
[Result of granting clause type]
Image forming device NP
In JEPSON_CUE
NEWLINE
PP outside
Connected VPK
Duct and NPT_P
NEWLINE
Air to NPO
VPK to discharge
Air blowing means, NPT_P
NEWLINE
Air to NPO
NP
VPK
Cleaning means and NPT_P
COMPOSE_R_CUE
NEWLINE
The duct is PP
Internal duct NP
COMPOSE_R_CUE
NEWLINE
The cleaning means is PP
PP inside the internal duct
VPK_P installed
FEATURE_K_CUE characterized by
Image forming apparatus. NP

この後、区切文節タイプ変更部18は、文節タイプの変更を行う(ステップS105)。その変更の具体的な方法は、次の通りである。なお、その方法の説明において、「名詞まとまり」とは名詞の連続である。その「名詞まとまり」は、文節タイプ「NP」の付与された文節であってもよく、文節タイプ「NPT」、「NPT_P」等の付与された文節に含まれる名詞の連続であってもよい。また、以下の説明において、トークンや文節タイプの付与された文節を、説明の便宜上、そのトークンや文節タイプそのもので表している。例えば、「VPR_P」は、厳密には、「VPR_Pの付与された文節」の意味である。   Thereafter, the delimiter clause type changing unit 18 changes the clause type (step S105). The specific method of the change is as follows. In the description of the method, the “noun group” is a series of nouns. The “noun group” may be a phrase to which the phrase type “NP” is assigned, or may be a series of nouns included in the assigned phrases such as the phrase types “NPT” and “NPT_P”. Further, in the following description, a clause to which a token or clause type is assigned is represented by the token or clause type itself for convenience of explanation. For example, “VPR_P” strictly means “a clause to which VPR_P is assigned”.

[文節タイプの変更の説明]
1.JEPSON_CUEが存在する場合は、以下の処理を行う。
(1)前半部(すなわち、特許請求項の先頭からJEPSON_CUEの直前までの部分)にFEATURE_CUE,FEATURE_K_CUE,COMPOSE_K_CUEのいずれかが存在する場合には、次の処理A、処理B、処理Cを行う。
(処理A)最後に出現したFEATURE_CUE,FEATURE_K_CUE,またはCOMPOSE_K_CUE以降の文節タイプをすべてHPに置き換える。
(処理B)COMPOSE_K_CUE,FEATURE_CUEの直前の「名詞まとまり」より前の部分、またはFEATURE_K_CUEより前の部分で、VPR_P,NPT_P,COMPOSE_R_CUE,または処理範囲(例えば、前半部の処理を行っている場合には前半部、後半部の処理を行っている場合には後半部、全体の処理を行っている場合には全体)の先頭のいずれかに遭遇するまでの間において、「名詞まとまり」の直前にVPKもしくはVPK_Pが存在していた場合、またはFEATURE_K_CUE直前にVPKもしくはVPK_Pが存在していた場合には、「名詞まとまり」の直前のVPKもしくはVPK_P以外と、FEATURE_K_CUEの直前のVPKもしくはVPK_P以外について、VPK*と、NP*をすべてPPに置き換える。
(処理C)処理Bにおいて、VPR_Pに遭遇した場合は、この処理を繰り返す。処理Bにおいて、NPT_Pに遭遇した場合は、それを含む「名詞まとまり」より前の部分で、この処理を繰り返す。処理Bにおいて、COMPOSE_R_CUEに遭遇した場合は、その直前の「名詞まとまり」より前の部分でこの処理を繰り返す。処理Bにおいて、処理範囲の先頭に遭遇した場合は、この処理を終了する。
(2)前半部に、FEATURE_CUE,FEATURE_K_CUE,COMPOSE_K_CUEのいずれも存在しない場合には、次の処理D、処理E、処理Fを行う。
(処理D)JEPSON_CUEの直前の「名詞まとまり」を認識し、それを構成する文節タイプをすべてHPに変更する。
(処理E)HPより前の部分で、VPR_P,NPT_P,COMPOSE_R_CUE,または処理範囲の先頭のいずれかに遭遇するまでの間において、HPの直前にVPKもしくはVPK_Pが存在していた場合には、HPの直前のVPKもしくはVPK_P以外について、VPK*と、NP*をすべてPPに置き換える。
(処理F)処理Eにおいて、VPR_Pに遭遇した場合は、この処理を繰り返す。処理Eにおいて、NPT_Pに遭遇した場合は、それを含む「名詞まとまり」より前の部分で、この処理を繰り返す。処理Eにおいて、COMPOSE_R_CUEに遭遇した場合は、その直前の「名詞まとまり」より前の部分でこの処理を繰り返す。処理Eにおいて、処理範囲の先頭に遭遇した場合は、この処理を終了する。
(3)前半部にNEWLINEが存在する場合には、次の処理Gを行う。
(処理G)NEWLINEが後続するVPKをVPK_Pに変更し、NEWLINEが後続するVPRをVPR_Pに変更し、NEWLINEが後続しないVPR_PをVPRに変更し、NEWLINEが後続しないVPK_PをVPKに変更する。
(4)後半部(すなわち、JEPSON_CUEの直後から特許請求項の終端までの部分)にFEATURE_CUE,FEATURE_K_CUE,COMPOSE_K_CUEのいずれかが存在する場合には、次の処理H,処理I、処理Jを行う。
(処理H)最後に出現したもの以降の文節タイプをすべてBPに置き換える。いずれも存在しない場合は、末尾の「名詞まとまり」を認識し、それを構成する文節タイプをすべてBPに置き換える。
(処理I)上記処理Bと同じ処理である。
(処理J)上記処理Cと同じ処理である。
(5)後半部に、FEATURE_CUE,FEATURE_K_CUE,COMPOSE_K_CUEのいずれも存在しない場合には、次の処理K、処理L、処理Mを行う。
(処理K)末尾の「名詞まとまり」を認識し、それを構成する文節タイプをすべてBPに変更する。
(処理L)上記処理Eにおいて、HPをBPに置き換えた処理を行う。
(処理M)上記処理Fにおいて、HPをBPに置き換えた処理を行う。
(6)後半部にNEWLINEが存在する場合には、上記処理Gを行う。
2.JEPSON_CUEが存在しない場合は、上記(4)〜(6)において後半部において行った処理を、特許請求項の全体に対して1回行う。
3.COMPOSE_K_CUE、COMPOSE_R_CUEの直前のNPTをNPT_Pに変更し、COMPOSE_K_CUE、COMPOSE_R_CUEの直前のNPをNPT_Pに変更する。
4.NEWLINEを除去する。
[Explanation of phrase type change]
1. When JEPSON_CUE exists, the following processing is performed.
(1) If any of FEATURE_CUE, FEATURE_K_CUE, COMPOSE_K_CUE exists in the first half (that is, the part from the beginning of the claims to immediately before JEPSON_CUE), the following processing A, processing B, and processing C are performed.
(Processing A) All clause types after FEATURE_CUE, FEATURE_K_CUE, or COMPOSE_K_CUE that appear last are replaced with HP.
(Processing B) VPR_P, NPT_P, COMPOSE_R_CUE, or processing range (for example, when processing of the first half is being performed in the part before the “noun group” immediately before COMPOSE_K_CUE, FEATURE_CUE, or the part before FEATURE_K_CUE VPK immediately before the “noun group” until the first half of the first half or the second half is processed, or the first half of the second half or the entire second when the entire process is performed. Alternatively, when VPK_P exists, or when VPK or VPK_P exists immediately before FEATURE_K_CUE, VP other than VPK or VPK_P immediately before “nouns” and other than VPK or VPK_P immediately before FEATURE_K_CUE, And K *, replace all the NP * PP.
(Process C) If VPR_P is encountered in Process B, this process is repeated. In the process B, when NPT_P is encountered, this process is repeated in a part before the “noun group” including the NPT_P. When the COMPOSE_R_CUE is encountered in the process B, this process is repeated in the part before the “noun group” immediately before. In the process B, when the head of the processing range is encountered, this process is terminated.
(2) When none of FEATURE_CUE, FEATURE_K_CUE, and COMPOSE_K_CUE exists in the first half, the following processing D, processing E, and processing F are performed.
(Process D) Recognize “noun group” immediately before JEPSON_CUE, and change all phrase types constituting it to HP.
(Processing E) If VPK or VPK_P exists immediately before HP before the HP encounters one of VPR_P, NPT_P, COMPOSE_R_CUE, or the head of the processing range before HP, HP VPK * and NP * are all replaced with PP except for VPK or VPK_P immediately before.
(Process F) When VPR_P is encountered in Process E, this process is repeated. In the process E, when NPT_P is encountered, this process is repeated in a part before the “noun group” including the NPT_P. In the process E, when COMPOSE_R_CUE is encountered, this process is repeated in the part before the “noun group” immediately before. In the process E, when the head of the processing range is encountered, this process is terminated.
(3) If NEWLINE exists in the first half, the next process G is performed.
(Process G) VPK followed by NEWLINE is changed to VPK_P, VPR followed by NEWLINE is changed to VPR_P, VPR_P not followed by NEWLINE is changed to VPR, and VPK_P not followed by NEWLINE is changed to VPK.
(4) If any of FEATURE_CUE, FEATURE_K_CUE, COMPOSE_K_CUE exists in the latter half (that is, the part immediately after JEPSON_CUE to the end of the claims), the following process H, process I, and process J are performed.
(Processing H) All phrase types after the last occurrence are replaced with BP. If none exists, the last “noun group” is recognized and all the phrase types constituting it are replaced with BP.
(Process I) The process is the same as the process B.
(Process J) This is the same process as Process C above.
(5) When none of FEATURE_CUE, FEATURE_K_CUE, and COMPOSE_K_CUE exists in the latter half, the following processing K, processing L, and processing M are performed.
(Processing K) Recognize the last “noun group” and change all the phrase types constituting it to BP.
(Process L) In the process E, the process of replacing HP with BP is performed.
(Process M) In the process F, the process of replacing HP with BP is performed.
(6) If NEWLINE exists in the latter half, the process G is performed.
2. When JEPSON_CUE does not exist, the processing performed in the latter half in the above (4) to (6) is performed once for the entire claim.
3. NPT immediately before COMPOSE_K_CUE and COMPOSE_R_CUE is changed to NPT_P, and NP immediately before COMPOSE_K_CUE and COMPOSE_R_CUE is changed to NPT_P.
4). Remove NEWLINE.

なお、上記の文節タイプの変更の説明において、処理Bや処理Eにおいて、VPK_P(終端区切文節タイプ)を、PPに置き換える処理が、終端区切文節タイプ(VPK_P)と、継続区切文節タイプ(VPR_P,NPT_P)との間に存在する終端区切文節タイプ(VPK_P)を削除する処理に対応する。また、処理Gにおいて、NEWLINEが後続しないVPR_PをVPRに変更し、NEWLINEが後続しないVPK_PをVPKに変更する処理が、改行が存在する場合であって、改行が後続しない動詞に関する区切文節タイプ(VPR_P,VPK_P)が存在する場合に、その区切文節タイプを削除する処理に対応する。
上記のようにして区切文節タイプ変更部18が変更した後の文節タイプは、次のようになる。
In the description of the phrase type change described above, in the process B and the process E, the process of replacing VPK_P (terminal delimiter phrase type) with PP is the terminal delimiter phrase type (VPK_P) and the continuation delimiter phrase type (VPR_P, This corresponds to the process of deleting the terminal delimiter clause type (VPK_P) existing between the NPT_P) and NPT_P). In process G, VPR_P that is not followed by NEWLINE is changed to VPR, and VPK_P that is not followed by NEWLINE is changed to VPK when there is a line break and the delimiter clause type (VPR_P) for a verb that does not follow a new line. , VPK_P) corresponds to the process of deleting the delimiter clause type.
The phrase type after the delimiter phrase type changing unit 18 changes as described above is as follows.

[文節タイプの変更の結果]
画像形成装置 HP
において、 JEPSON_CUE
外部に PP
接続される VPK
ダクトと、 NPT_P
エアを PP
排出する VPK
送風手段と、 NPT_P
エアを PP
清浄化 PP
する VPK
清浄化手段と、 NPT_P
を備え、 COMPOSE_R_CUE
前記ダクトは PP
内部ダクト NPT_P
を有し、 COMPOSE_R_CUE
前記清浄化手段は、 PP
前記内部ダクト内に PP
設置されている、 VPK_P
ことを特徴とする FEATURE_K_CUE
画像形成装置。 BP
[Result of phrase type change]
Image forming device HP
In JEPSON_CUE
PP outside
Connected VPK
Duct and NPT_P
PP for air
VPK to discharge
Air blowing means, NPT_P
PP for air
Cleaning PP
VPK
Cleaning means and NPT_P
COMPOSE_R_CUE
The duct is PP
Internal duct NPT_P
COMPOSE_R_CUE
The cleaning means is PP
PP inside the internal duct
VPK_P installed
FEATURE_K_CUE characterized by
Image forming apparatus. BP

その後、生成部19は、トークンと文節タイプとの付与された特許請求項情報から、請求項構造情報を生成する(ステップS106)。その生成において、この具体例では、その生成において、図6で示される文法ファイルを用いて、パーサジェネレータによって生成されたパーサ(構文解析器)を用いて、請求項構造情報を生成するものとする。なお、その図6の文法ファイルは、パーサジェネレータであるBison互換のPerl用ツールであるParse::Yapp(Francois Desarmenien,Parse−Yapp−1.05、http://search.cpan.org/dist/Parse−Yapp/)用の記述例である。特許請求項の記述は、通常、終端に定型的な表現が存在し、終端から先頭への方向で構造が確定することを考慮し、その文脈自由文法で記述した規則は、終端から先頭への方向で記述した。図6では、$retvalという変数に、生成されたXMLが文字列として格納される。図6で示される文法ファイルから生成されたパーサに、上記文節タイプの変更の結果を取り込むと、図7のXMLファイルで示される請求項構造情報が生成される。なお、その際、文脈自由文法から生成されたパーサには、文節タイプの変更の結果を、終端から先頭への方向に変換して入力する。また、XMLの構造としては、前述したPMLを使用した。   Thereafter, the generation unit 19 generates claim structure information from the claim information to which the token and the phrase type are assigned (step S106). In the generation, in this specific example, the claim structure information is generated by using the parser (syntax analyzer) generated by the parser generator using the grammar file shown in FIG. . The grammar file in FIG. 6 is Parse :: Yapp (Francois Desarmenien, Parse-Yapp-1.05, http://search.cpan.org/dist/) which is a parser tool for Bison compatible Perl. This is a description example for Parse-Yapp /). Considering that there is usually a canonical expression at the end and the structure is fixed in the direction from the end to the beginning, the description in the context-free grammar is written in the description of the claims from the end to the beginning. Described by direction. In FIG. 6, the generated XML is stored as a character string in a variable called $ retval. When the result of the phrase type change is taken into the parser generated from the grammar file shown in FIG. 6, the claim structure information shown in the XML file in FIG. 7 is generated. At that time, the phrase type change result is converted into the direction from the end to the beginning and input to the parser generated from the context-free grammar. As the XML structure, the aforementioned PML was used.

出力部20は、図7の請求項構造情報を読み込んでディスプレイに表示する。その結果、図8で示される、請求項構造情報に応じた記述断片の関係を示す表示が行われる(ステップS107)。この表示を見ることによって、ユーザは、特許請求項の構造を容易に把握することができるようになる。なお、図7で示されるXMLファイルから、図8で示される表示を生成する際にも、構文解析器(パーサ)が用いられてもよい。このパーサは、マークアップ言語で記述された構造を表示する公知のパーサである。   The output unit 20 reads the claim structure information of FIG. 7 and displays it on the display. As a result, the display showing the relationship between the description fragments according to the claim structure information shown in FIG. 8 is performed (step S107). By viewing this display, the user can easily grasp the structure of the claims. Note that a parser (parser) may also be used when generating the display shown in FIG. 8 from the XML file shown in FIG. This parser is a known parser that displays a structure described in a markup language.

ここで、上記の文節タイプの変更の結果から、記述断片の間の係り受けを示す請求項構造情報を生成する別の処理の具体例について、簡単に説明する。文節タイプの変更の結果において、JEPSON_CUE以外の各トークンと、NPT_Pと、BPとは、それだけで一つの記述断片となる。すなわち、JEPSON_CUE以外の各トークンと、NPT_Pと、BPとについては、その前後に記述断片の区切位置が来ることになる。また、VPR_Pと、VPK_Pとは、それらの直前に連続する0個以上のPPやVPR,VPKを含んで一つの記述断片となる。すなわち、VPR_Pと、VPK_Pとについては、その後に記述断片の区切位置が来ることになる。また、HPとJEPSON_CUEとは、両方で一つの記述断片となる。すなわち、「HP+JEPSON_CUE」については、その前後に記述断片の区切位置が来ることになる。残った連続する1以上のPPやVPR,VPKも、一つの記述断片となる。このような、トークン及び区切文節タイプに対応した記述断片の区切位置を示す情報を用いることによって、生成部19は、記述断片の区切位置を特定することができることになる。そのようにして、文節タイプの変更の結果を記述断片ごとに示し、その記述断片に対して、最後の文節に対応する文節タイプを対応付けた結果は、次のようになる。   Here, a specific example of another process for generating the claim structure information indicating the dependency between the description fragments from the result of the change in the phrase type will be briefly described. As a result of the phrase type change, each token other than JEPSON_CUE, NPT_P, and BP alone become one description fragment. That is, for each token other than JEPSON_CUE, NPT_P, and BP, the delimiter position of the description fragment comes before and after the token. Further, VPR_P and VPK_P are one description fragment including zero or more PPs, VPRs, and VPKs immediately preceding them. That is, for VPR_P and VPK_P, the delimiter position of the description fragment follows. Further, both HP and JEPSON_CUE become one description fragment. That is, for “HP + JEPSSON_CUE”, the delimiter position of the description fragment comes before and after that. The remaining one or more continuous PPs, VPRs, and VPKs also become one description fragment. By using such information indicating the delimitation position of the description fragment corresponding to the token and delimiter clause type, the generation unit 19 can specify the delimitation position of the description fragment. As described above, the result of the phrase type change is shown for each description fragment, and the result of associating the phrase type corresponding to the last clause with the description fragment is as follows.

画像形成装置において、 JEPSON_CUE
外部に接続される VPK
ダクトと、 NPT_P
エアを排出する VPK
送風手段と、 NPT_P
エアを清浄化する VPK
清浄化手段と、 NPT_P
を備え、 COMPOSE_R_CUE
前記ダクトは PP
内部ダクト NPT_P
を有し、 COMPOSE_R_CUE
前記清浄化手段は、前記内部ダクト内に設置されている、 VPK_P
ことを特徴とする FEATURE_K_CUE
画像形成装置。 BP
In the image forming apparatus, JEPSON_CUE
VPK connected to outside
Duct and NPT_P
VPK that discharges air
Air blowing means, NPT_P
VPK to clean air
Cleaning means and NPT_P
COMPOSE_R_CUE
The duct is PP
Internal duct NPT_P
COMPOSE_R_CUE
The cleaning means is installed in the internal duct, VPK_P
FEATURE_K_CUE characterized by
Image forming apparatus. BP

また、トークンの付与された記述断片及び区切文節タイプの付与された記述断片の係り受け関係が次のように定められているものとする。前半部と、後半部または全体とに分けて説明する。なお、以下の説明において、トークンの付与された記述断片や、文節タイプの付与された記述断片を、説明の便宜上、そのトークンや文節タイプそのもので表している。例えば、「COMPOSE_K_CUE」は、厳密には、「COMPOSE_K_CUEの付与された記述断片」の意味である。   Further, it is assumed that the dependency relationship between the description fragment to which the token is assigned and the description fragment to which the delimiter clause type is assigned is defined as follows. The description will be divided into the first half and the second half or the whole. In the following description, a description fragment to which a token is assigned or a description fragment to which a phrase type is assigned is represented by the token or the phrase type itself for convenience of explanation. For example, “COMPOSE_K_CUE” strictly means “descriptive fragment to which COMPOSE_K_CUE is assigned”.

(前半部)
COMPOSE_K_CUEは、それよりも後に存在する、それに最も近い、JEPSON_CUE、FEATURE_CUE、または、FEATURE_K_CUEに係る。
COMPOSE_R_CUEは、それよりも後に存在する、それに最も近い、JEPSON_CUE、FEATURE_CUE、または、FEATURE_K_CUEに係る。
FEATURE_CUEは、JEPSON_CUEに係る。
FEATURE_K_CUEは、JEPSON_CUEに係る。
NPT_Pは、それよりも後に存在する、それに最も近い、COMPOSE_K_CUEまたはCOMPOSE_R_CUEに係る。
VPKは、直後の記述断片に係る。
VPK_Pは、直後の記述断片に係る。
VPRは、それよりも後に存在する、それに最も近い、VPK(またはVPK_P)の直後の記述断片に係る。
VPR_Pは、それよりも後に存在する、それに最も近い、VPK(またはVPK_P)の直後の記述断片に係る。
PPは、直後の記述断片に係る。
(後半部、または全体)
JEPSON_CUEは、BPに係る。
COMPOSE_K_CUEは、それよりも後に存在する、それに最も近い、BP、FEATURE_CUE、または、FEATURE_K_CUEに係る。
COMPOSE_R_CUEは、それよりも後に存在する、それに最も近い、BP、FEATURE_CUE、または、FEATURE_K_CUEに係る。
FEATURE_CUEは、BPに係る。
FEATURE_K_CUEは、BPに係る。
NPT_Pは、それよりも後に存在する、それに最も近い、COMPOSE_K_CUEまたはCOMPOSE_R_CUEに係る。
VPKは、直後の記述断片に係る。
VPK_Pは、直後の記述断片に係る。
VPRは、それよりも後に存在する、それに最も近い、VPK(またはVPK_P)の直後の記述断片に係る。
VPR_Pは、それよりも後に存在する、それに最も近い、VPK(またはVPK_P)の直後の記述断片に係る。
PPは、直後の記述断片に係る。
(First half)
COMPOSE_K_CUE relates to JEPSON_CUE, FEATURE_CUE, or FEATURE_K_CUE that is closest to and exists after that.
COMPOSE_R_CUE relates to JEPSON_CUE, FEATURE_CUE, or FEATURE_K_CUE that is closest to and exists after that.
FEATURE_CUE relates to JEPSON_CUE.
FEATURE_K_CUE relates to JEPSON_CUE.
NPT_P relates to COMPOSE_K_CUE or COMPOSE_R_CUE that is closest to and exists after that.
VPK relates to the description fragment immediately after.
VPK_P relates to the immediately following description fragment.
The VPR relates to the description fragment immediately after the VPK (or VPK_P) that exists after that and is closest to it.
VPR_P relates to a description fragment immediately after VPK (or VPK_P) that is present and closest to VPR_P.
PP relates to the immediately following description fragment.
(Second half or whole)
JEPSON_CUE relates to BP.
COMPOSE_K_CUE relates to BP, FEATURE_CUE, or FEATURE_K_CUE that is closest to and exists after that.
COMPOSE_R_CUE relates to BP, FEATURE_CUE, or FEATURE_K_CUE that is closest to and exists after that.
FEATURE_CUE relates to BP.
FEATURE_K_CUE relates to BP.
NPT_P relates to COMPOSE_K_CUE or COMPOSE_R_CUE that is closest to and exists after that.
VPK relates to the description fragment immediately after.
VPK_P relates to the immediately following description fragment.
The VPR relates to the description fragment immediately after the VPK (or VPK_P) that exists after that and is closest to it.
VPR_P relates to a description fragment immediately after VPK (or VPK_P) that is present and closest to VPR_P.
PP relates to the immediately following description fragment.

生成部19は、あらかじめ規定されているトークンの付与された記述断片及び区切文節タイプの付与された記述断片の係り受け関係の情報(図示しない記録媒体で記憶されていてもよい)を用いることによって、各記述断片の係り受け関係を特定することができる。この例の場合には、各記述断片の係り先を特定することができることになる。これが次で示される請求項構造情報となる。なお、その請求項構造情報において、「記述断片ID」、「記述断片の文字列」、「記述断片に対応するトークンまたは文節タイプ」、「係り先の記述断片ID」の順で表示している。   The generation unit 19 uses dependency information (which may be stored in a recording medium (not shown)) of a description fragment to which a predetermined token is assigned and a description fragment to which a delimiter clause type is assigned. The dependency relationship of each description fragment can be specified. In the case of this example, the destination of each description fragment can be specified. This is the claim structure information shown below. In the claim structure information, “descriptive fragment ID”, “character string of descriptive fragment”, “token or clause type corresponding to descriptive fragment”, “description fragment ID of destination” are displayed in this order. .

[請求項構造情報]
1 画像形成装置において、 JEPSON_CUE 14
2 外部に接続される VPK 3
3 ダクトと、 NPT_P 8
4 エアを排出する VPK 5
5 送風手段と、 NPT_P 8
6 エアを清浄化する VPK 7
7 清浄化手段と、 NPT_P 8
8 を備え、 COMPOSE_R_CUE 13
9 前記ダクトは PP 10
10 内部ダクト NPT_P 11
11 を有し、 COMPOSE_R_CUE 13
12 前記清浄化手段は、前記内部ダクト内に設置されている、 VPK_P 13
13 ことを特徴とする FEATURE_K_CUE 14
14 画像形成装置。 BP
[Claim structure information]
1 In the image forming apparatus, JEPSON_CUE 14
2 VPK connected to outside 3
3 Duct and NPT_P 8
4 Discharge air VPK 5
5 blowing means and NPT_P 8
6 VPK to clean air 7
7 Cleaning means and NPT_P 8
8 and COMPOSE_R_CUE 13
9 The duct is PP 10
10 Internal duct NPT_P 11
11 and COMPOSE_R_CUE 13
12 The cleaning means is installed in the internal duct, VPK_P 13
13 FEATURE_K_CUE 14
14 Image forming apparatus. BP

出力部20が、この請求項構造情報を記述断片の係り受けを示すように表示すると、図8の表示となる。なお、係り受け関係を有する複数の情報を表示する方法としては、例えば、自然言語処理における係り受け関係を表示するソフトウェアや、クレームツリーの表示ソフトウェア等としてすでに知られており、その詳細な説明を省略する。   When the output unit 20 displays the claim structure information so as to indicate the dependency of the description fragment, the display shown in FIG. 8 is obtained. As a method of displaying a plurality of pieces of information having a dependency relationship, for example, software that displays a dependency relationship in natural language processing or software for displaying a claim tree is already known, and a detailed description thereof will be given. Omitted.

なお、QUOTE_CUEについては特に言及しなかったが、QUOTE_CUEが存在する場合には、その直前の位置で記述断片の区切位置が存在することになる。また、そのQUOTE_CUEを先頭に含む記述断片は、前半部においてはJEPSON_CUEの記述断片に係り、後半部においては、BPに係ることになる。このようにして、QUOTE_CUEが含まれる場合にも、記述断片への分割と、その係り受け関係の特定とを行うことができるようになる。   Note that QUIOTE_CUE was not particularly mentioned, but when QUIOTE_CUE exists, the delimiter position of the description fragment exists at the position immediately before it. Further, the description fragment including the QUIOTE_CUE at the head is related to the description fragment of JEPSON_CUE in the first half, and is related to BP in the second half. In this way, even when QUEOTE_CUE is included, it is possible to divide into description fragments and specify the dependency relationship.

以上のように、本実施の形態による請求項構造情報生成装置1によれば、表層の手がかり情報と、品詞の手がかり情報とを用いて、文節単位で記述断片の区切位置を検出するため、より深い構造を持つ特許請求項についても構造解析を適切に行うことができるようになる。特に、品詞の手がかり情報を用いることによって、区切位置となりうるすべての箇所を見つけることができるようになる。なお、そのようにして見つけた区切位置には、本来は区切位置とすべきでない箇所も含まれてしまう場合もある。したがって、区切文節タイプ変更部18による文節タイプの変更、特に区切文節タイプの削除を行うことによって、そのような適切でない区切位置を削除することによって、本来の記述断片を取得することができるようになる。なお、従来例では、文節よりも細かい形態素単位で記述断片の区切位置の検出等を行っていたため、大まかな解析しかすることができなかった。扱う単位が細かいため、細かい解析を行うことは非常に困難だからである。一方、本実施の形態では、文節単位で記述断片の区切位置の検出等を行うため、従来例よりも細かい解析を行うことができるようになり、その結果、より深い構造を持った請求項についても、適切な解析を行うことができるようになった。このようにして、従来例では図16の程度にしか解析することができなかったものを、本実施の形態では、図8のように細かく解析することができるようになった。   As described above, according to the claim structure information generation device 1 according to the present embodiment, since the clue information on the surface layer and the clue information on the part of speech are used to detect the break position of the description fragment in phrase units, The structural analysis can be appropriately performed even for the claims having a deep structure. In particular, by using the part-of-speech clue information, it is possible to find all the locations that can be the delimiter positions. Note that the break position found in this way may include a portion that should not be a break position. Therefore, the original description fragment can be acquired by deleting such an inappropriate delimiter position by changing the phrase type by the delimiter-phrase type changing unit 18, particularly by deleting the delimiter-phrase type. Become. In the conventional example, the delimiter position of the description fragment is detected in units of morphemes smaller than the clause, so that only a rough analysis can be performed. This is because it is very difficult to perform a detailed analysis because the units handled are fine. On the other hand, in the present embodiment, because it detects the break position of the description fragment in phrase units, it becomes possible to perform a finer analysis than the conventional example, and as a result, a claim with a deeper structure Even now, an appropriate analysis can be performed. In this way, what can be analyzed only to the extent of FIG. 16 in the conventional example can be analyzed finely as shown in FIG. 8 in the present embodiment.

また、本実施の形態において、従属関係に対応する表層の手がかり情報をも用いることによって、他の請求項に従属する請求項についても、その構造を適切に解析することができ、その請求項に対応した請求項構造情報を生成することができる。   Further, in the present embodiment, by using the surface layer clue information corresponding to the dependency relationship, the structure of a claim dependent on another claim can be analyzed appropriately. Corresponding claim structure information can be generated.

なお、本実施の形態による請求項構造情報生成装置1において、構成要素の親子関係に関する構造の解析をさらに行ってもよい。この場合には、区切文節タイプに、前述の構成要素の包含関係を示すトークンに対して、親の構成要素に応じた区切文節タイプである親区切文節タイプと、構成要素の包含関係を示すトークンに対して、子の構成要素に応じた区切文節タイプである子区切文節タイプと、が存在するものとする。構成要素の包含関係を示すトークンは、例えば、既出のCOMPOSE_K_CUEやCOMPOSE_R_CUEである。また、親区切文節タイプは、例えば、既出のHPやBP、ここで定義するNPH、NPH_P等である。また、子区切文節タイプは、例えば、既出のNPT_Pである。   In addition, in the claim structure information generation apparatus 1 according to the present embodiment, a structure analysis regarding a parent-child relationship of components may be further performed. In this case, the token that indicates the inclusion relationship of the component and the token that indicates the inclusion relationship of the parent component and the token that indicates the inclusion relationship between the parent component and the token that indicates the inclusion relationship of the component. On the other hand, it is assumed that there is a child delimiter clause type that is a delimiter clause type corresponding to a child component. The token indicating the inclusion relationship of the constituent elements is, for example, the above-mentioned COMPOSE_K_CUE or COMPOSE_R_CUE. Further, the parent break clause type is, for example, the above-described HP or BP, NPH, NPH_P, or the like defined here. The child break clause type is, for example, the above-mentioned NPT_P.

文節タイプ対応情報において、区切文節タイプNPH、NPH_Pに対応する品詞の手がかり情報は、例えば、次のようになる。
NPH:X+助詞「は」
NPH_P:X+助詞「は」+「記号−読点(「、」または「,」)」
すなわち、例えば、前述の具体例の場合には、「前記ダクトは」がNPHとなる。
In the phrase type correspondence information, the part-of-speech clue information corresponding to the delimited phrase types NPH and NPH_P is, for example, as follows.
NPH: X + particle "ha"
NPH_P: X + particle "ha" + "symbol-punctuation (", "or", ")"
That is, for example, in the above-described specific example, “the duct” is NPH.

このような場合において、出力部20は、親区切文節タイプに対応する記述断片と、子区切文節タイプに対応する記述断片との親子関係が分かるように両記述断片を表示してもよい。例えば、出力部20は、親区切文節タイプに対応する記述断片と、子区切文節タイプに対応する記述断片とを線で結んで表示してもよい。なお、その親区切文節タイプに対応する記述断片と、子区切文節タイプに対応する記述断片との間に、構成要素の包含関係に関する記述断片が存在してもよい。すなわち、親区切文節タイプに対応する記述断片と、子区切文節タイプに対応する記述断片とは、構成要素の包含関係に関する記述断片を介して線で結ばれてもよい。また、出力部20は、結果としてそのような表示を行えばよく、例えば、親区切文節タイプに対応する記述断片と、子区切文節タイプに対応する記述断片とが直接的にまたは間接的に係り受け関係にあることを示す請求項構造情報が生成されている場合には、それを本実施の形態で説明したように表示するだけであってもよい。   In such a case, the output unit 20 may display both description fragments so that the parent-child relationship between the description fragment corresponding to the parent break clause type and the description fragment corresponding to the child break clause type can be understood. For example, the output unit 20 may display the description fragment corresponding to the parent delimiter clause type and the description fragment corresponding to the child delimiter clause type by connecting with a line. Note that there may be a description fragment related to the inclusion relationship between the constituent elements between the description fragment corresponding to the parent delimiter clause type and the description fragment corresponding to the child delimiter clause type. That is, the description fragment corresponding to the parent delimiter clause type and the description fragment corresponding to the child delimiter clause type may be connected by a line via the description fragment regarding the inclusion relation of the constituent elements. In addition, the output unit 20 may perform such display as a result. For example, the description fragment corresponding to the parent break clause type and the description fragment corresponding to the child break clause type are directly or indirectly related. If the claim structure information indicating the receiving relationship is generated, it may be displayed as described in the present embodiment.

ここで、具体例を用いて説明する。
(α)文節タイプの変更の際には、前述の具体例の変更を行うと共に、その変更の後に、次の処理を行うものとする。
(β)NPHの後に、COMPOSE_K_CUEまたはCOMPOSE_R_CUEが存在しない場合には、NPHをPPに変更する。
(γ)NPHと、それよりも後に存在する、それに最も近い、COMPOSE_K_CUEまたはCOMPOSE_R_CUEとの間に、NPT_Pが存在しない場合には、NPHをPPに変更する。
(δ)NPHと、それよりも後に存在する、それに最も近い、NPT_Pとの間に、VPR_Pが存在する場合には、NPHを、PPに変更する。
(ε)NPH_Pについても、NPHをNPH_Pに置き換えて、上記(β)〜(δ)の処理を行う。
Here, it demonstrates using a specific example.
(Α) When changing the phrase type, the specific example described above is changed, and the following processing is performed after the change.
(Β) If COMPOSE_K_CUE or COMPOSE_R_CUE does not exist after NPH, NPH is changed to PP.
(Γ) If NPT_P does not exist between NPH and COMPOSE_K_CUE or COMPOSE_R_CUE that is present and closest to NPH, change NPH to PP.
(Δ) If VPR_P exists between NPH and NPT_P that is present and closest to NPH, NPH is changed to PP.
(Ε) NPH_P is also replaced with NPH_P and the processes (β) to (δ) are performed.

上記(α)〜(δ)の処理を行うことによって、文節タイプの変更の結果は次のようになる。
[文節タイプの変更の結果]
画像形成装置 HP
において、 JEPSON_CUE
外部に PP
接続される VPK
ダクトと、 NPT_P
エアを PP
排出する VPK
送風手段と、 NPT_P
エアを PP
清浄化 PP
する VPK
清浄化手段と、 NPT_P
を備え、 COMPOSE_R_CUE
前記ダクトは NPH
内部ダクト NPT_P
を有し、 COMPOSE_R_CUE
前記清浄化手段は、 PP
前記内部ダクト内に PP
設置されている、 VPK_P
ことを特徴とする FEATURE_K_CUE
画像形成装置。 BP
By performing the processes (α) to (δ), the result of the phrase type change is as follows.
[Result of phrase type change]
Image forming device HP
In JEPSON_CUE
PP outside
Connected VPK
Duct and NPT_P
PP for air
VPK to discharge
Air blowing means, NPT_P
PP for air
Cleaning PP
VPK
Cleaning means and NPT_P
COMPOSE_R_CUE
The duct is NPH
Internal duct NPT_P
COMPOSE_R_CUE
The cleaning means is PP
PP inside the internal duct
VPK_P installed
FEATURE_K_CUE characterized by
Image forming apparatus. BP

次に、記述断片の区切位置の特定の際には、NPH、NPH_Pも一つの記述断片になるとする。すなわち、NPHと、NPH_Pとについては、その前後に記述断片の区切位置が来ることになる。また、あらかじめ規定されている係り受け関係に、次のNPH、NPH_Pの係り先の関係を追加し、COMPOSE_K_CUEまたはCOMPOSE_R_CUEの係り先の関係を次のように変更する。   Next, it is assumed that NPH and NPH_P also become one description fragment when specifying the delimiter position of the description fragment. That is, for NPH and NPH_P, description fragment delimiters come before and after the NPH and NPH_P. Further, the relationship of the next NPH and NPH_P is added to the predetermined dependency relationship, and the relationship of the COMPOSE_K_CUE or COMPOSE_R_CUE is changed as follows.

(前半部)
(追加)NPHは、それよりも後に存在する、それに最も近い、JEPSON_CUE、FEATURE_CUE、または、FEATURE_K_CUEに係る。
(追加)NPH_Pは、それよりも後に存在する、それに最も近い、JEPSON_CUE、FEATURE_CUE、または、FEATURE_K_CUEに係る。
(変更)COMPOSE_K_CUEは、それよりも前にNPHまたはNPH_Pが存在する場合には、そのCOMPOSE_K_CUEよりも前に存在する、それに最も近いNPHまたはNPH_Pに係り、そのCOMPOSE_K_CUEよりも前にNPH及びNPH_Pが存在しない場合には、そのCOMPOSE_K_CUEよりも後に存在する、それに最も近い、JEPSON_CUE、FEATURE_CUE、または、FEATURE_K_CUEに係る。
(変更)COMPOSE_R_CUEは、それよりも前にNPHまたはNPH_Pが存在する場合には、そのCOMPOSE_R_CUEよりも前に存在する、それに最も近いNPHまたはNPH_Pに係り、そのCOMPOSE_R_CUEよりも前にNPH及びNPH_Pが存在しない場合には、そのCOMPOSE_R_CUEよりも後に存在する、それに最も近い、JEPSON_CUE、FEATURE_CUE、または、FEATURE_K_CUEに係る。
(後半部、または全体)
(追加)NPHは、それよりも後に存在する、それに最も近い、BP、FEATURE_CUE、または、FEATURE_K_CUEに係る。
(追加)NPH_Pは、それよりも後に存在する、それに最も近い、BP、FEATURE_CUE、または、FEATURE_K_CUEに係る。
(変更)COMPOSE_K_CUEは、それよりも前にNPHまたはNPH_Pが存在する場合には、そのCOMPOSE_K_CUEよりも前に存在する、それに最も近いNPHまたはNPH_Pに係り、そのCOMPOSE_K_CUEよりも前にNPH及びNPH_Pが存在しない場合には、そのCOMPOSE_K_CUEよりも後に存在する、それに最も近い、BP、FEATURE_CUE、または、FEATURE_K_CUEに係る。
(変更)COMPOSE_R_CUEは、それよりも前にNPHまたはNPH_Pが存在する場合には、そのCOMPOSE_R_CUEよりも前に存在する、それに最も近いNPHまたはNPH_Pに係り、そのCOMPOSE_R_CUEよりも前にNPH及びNPH_Pが存在しない場合には、そのCOMPOSE_R_CUEよりも後に存在する、それに最も近い、BP、FEATURE_CUE、または、FEATURE_K_CUEに係る。
(First half)
(Addition) NPH is related to JEPSON_CUE, FEATURE_CUE, or FEATURE_K_CUE that is closest to and exists after that.
(Addition) NPH_P relates to JEPSON_CUE, FEATURE_CUE, or FEATURE_K_CUE that is present closest to the NPH_P.
(Change) If COMPE_K_CUE has NPH or NPH_P before it, it is related to NPH or NPH_P that is closest to that COMPOSE_K_CUE, and NPH and NPH_P exist before that COMPOSE_K_CUE If not, it relates to JEPSON_CUE, FEATURE_CUE, or FEATURE_K_CUE that is closest to and exists after that COMPOSE_K_CUE.
(Change) When COMPOSE_R_CUE has NPH or NPH_P before it, it is related to NPH or NPH_P that is closest to that COMPOSE_R_CUE, and has NPH and NPH_P before that COMPOSE_R_CUE. If not, it is related to JEPSON_CUE, FEATURE_CUE, or FEATURE_K_CUE which is present after that COMPOSE_R_CUE and is closest thereto.
(Second half or whole)
(Addition) NPH is related to BP, FEATURE_CUE, or FEATURE_K_CUE that is closest to and exists after that.
(Addition) NPH_P relates to BP, FEATURE_CUE, or FEATURE_K_CUE that is present and closest to it.
(Change) If COMPE_K_CUE has NPH or NPH_P before it, it is related to NPH or NPH_P that is closest to that COMPOSE_K_CUE, and NPH and NPH_P exist before that COMPOSE_K_CUE If not, it relates to BP, FEATURE_CUE, or FEATURE_K_CUE that is closest to and exists after that COMPOSE_K_CUE.
(Change) When COMPOSE_R_CUE has NPH or NPH_P before it, it is related to NPH or NPH_P that is closest to that COMPOSE_R_CUE, and has NPH and NPH_P before that COMPOSE_R_CUE. If not, it is related to BP, FEATURE_CUE, or FEATURE_K_CUE which is present after that COMPOSE_R_CUE and is closest thereto.

このような係り受け関係に応じて請求項構造情報を生成すると、次のようになる。
[請求項構造情報]
1 画像形成装置において、 JEPSON_CUE 14
2 外部に接続される VPK 3
3 ダクトと、 NPT_P 8
4 エアを排出する VPK 5
5 送風手段と、 NPT_P 8
6 エアを清浄化する VPK 7
7 清浄化手段と、 NPT_P 8
8 を備え、 COMPOSE_R_CUE 13
9 前記ダクトは NPH 13
10 内部ダクト NPT_P 11
11 を有し、 COMPOSE_R_CUE 9
12 前記清浄化手段は、前記内部ダクト内に設置されている、 VPK_P 13
13 ことを特徴とする FEATURE_K_CUE 14
14 画像形成装置。 BP
When the claim structure information is generated according to such a dependency relationship, it is as follows.
[Claim structure information]
1 In the image forming apparatus, JEPSON_CUE 14
2 VPK connected to outside 3
3 Duct and NPT_P 8
4 Discharge air VPK 5
5 blowing means and NPT_P 8
6 VPK to clean air 7
7 Cleaning means and NPT_P 8
8 and COMPOSE_R_CUE 13
9 The duct is NPH 13
10 Internal duct NPT_P 11
11 and COMPOSE_R_CUE 9
12 The cleaning means is installed in the internal duct, VPK_P 13
13 FEATURE_K_CUE 14
14 Image forming apparatus. BP

また、出力部20が、この請求項構造情報を表示すると、例えば、図9で示されるようになる。図9では、親子関係のある構成要素の記述断片が、「を備え、」や「ことを特徴とする」、または、「を有し、」を介して、接続されることになる。例えば、「ダクトと、」、「送風手段と、」、「清浄化手段と、」が、「を備え、」等を介して「画像形成装置。」に接続されていることによって、「画像形成装置。」が、「ダクトと、」、「送風手段と、」、「清浄化手段と、」を構成要素として有することが分かる。また、「内部ダクト」が、「を有し、」を介して「前記ダクトは」に接続されていることによって、「前記ダクトは」が、「内部ダクト」を構成要素として有することが分かる。   Further, when the output unit 20 displays the claim structure information, for example, as shown in FIG. In FIG. 9, description fragments of components having a parent-child relationship are connected via “comprises”, “characteristically”, or “has”. For example, “image forming device” is connected to “image forming apparatus” via “comprising” and the like, with “duct and”, “air blowing device”, and “cleaning device”. It can be seen that the "apparatus" has "duct," "blower means," and "cleaning means" as components. In addition, it is understood that “the duct” has “inner duct” as a constituent element because “the duct” is connected to “the duct” via “has”.

なお、出力部20は、構成要素に関する複数の記述断片のうち、語幹が同じものを共通化して表示してもよい。記述断片の語幹とは、末尾の句読点や助詞、または、先頭の「前記」、「上記」、「当該」、「該」、「その」等の、既出のものを示す接頭語を記述断片から除去した部分である。したがって、「前記ダクトは」と、「ダクトと、」とは、語幹「ダクト」が共通することになる。その共通化する場合に、語幹が共通する複数の記述断片のうち、先頭の記述断片に他の記述断片を統合してもよく、または、COMPOSE_K_CUEもしくはCOMPOSE_R_CUEに係る記述断片に他の記述断片を統合してもよい。その結果、例えば、図10で示される表示がなされる。ここでは、出力部20がそのような出力を行う場合について説明したが、生成部19が、そのような請求項構造情報を生成してもよい。例えば、前述の例の場合には、請求項構造情報において、構成要素に関する記述断片は、NPT_P、NPH、NPH_Pであるため、それらの語幹が共通するかどうか判断する。この場合には、「ダクトと、」、「前記ダクトは」の語幹が共通すると判断される。その結果、2番目以降の記述断片「前記ダクトは」に係る記述断片「を有し、」の係り先を、1番目の記述断片「ダクトと、」に変更すると共に、2番目以降の記述断片「前記ダクトは」を削除すればよいことになる。その結果、請求項構造情報が、次のようになる。   Note that the output unit 20 may display a plurality of description fragments related to the constituent elements in common with the same stem. The stem of a description fragment is a punctuation mark or particle at the end, or a prefix indicating an existing one such as “above”, “above”, “this”, “this”, “that”, etc. from the description fragment. It is the removed part. Therefore, “the duct” and “the duct” have the common word “duct”. In the case of commonization, other description fragments may be integrated into the first description fragment among a plurality of description fragments with a common stem, or other description fragments may be integrated into the description fragment related to COMPOSE_K_CUE or COMPOSE_R_CUE May be. As a result, for example, the display shown in FIG. 10 is performed. Here, the case where the output unit 20 performs such output has been described, but the generation unit 19 may generate such claim structure information. For example, in the case of the above-described example, in the claim structure information, the description fragments related to the constituent elements are NPT_P, NPH, and NPH_P, so it is determined whether or not their stems are common. In this case, it is determined that the stems of “duct and” and “the duct is” are common. As a result, the description fragment “having a description fragment“ having a duct ”related to the second and subsequent description fragments is changed to the first description fragment“ duct ”, and the second and subsequent description fragments. It is only necessary to delete “the duct”. As a result, the claim structure information is as follows.

[請求項構造情報]
1 画像形成装置において、 JEPSON_CUE 14
2 外部に接続される VPK 3
3 ダクトと、 NPT_P 8
4 エアを排出する VPK 5
5 送風手段と、 NPT_P 8
6 エアを清浄化する VPK 7
7 清浄化手段と、 NPT_P 8
8 を備え、 COMPOSE_R_CUE 13
10 内部ダクト NPT_P 11
11 を有し、 COMPOSE_R_CUE 3
12 前記清浄化手段は、前記内部ダクト内に設置されている、 VPK_P 13
13 ことを特徴とする FEATURE_K_CUE 14
14 画像形成装置。 BP
[Claim structure information]
1 In the image forming apparatus, JEPSON_CUE 14
2 VPK connected to outside 3
3 Duct and NPT_P 8
4 Discharge air VPK 5
5 blowing means and NPT_P 8
6 VPK to clean air 7
7 Cleaning means and NPT_P 8
8 and COMPOSE_R_CUE 13
10 Internal duct NPT_P 11
11 and COMPOSE_R_CUE 3
12 The cleaning means is installed in the internal duct, VPK_P 13
13 FEATURE_K_CUE 14
14 Image forming apparatus. BP

この例では、一つの請求項において、語幹の共通する、構成要素に関する記述断片をまとめる場合について説明したが、従属関係にある請求項において、そのことを行ってもよい。例えば、上記例の請求項に従属する請求項において、「……前記送風手段は、羽根と、前記羽根を回転させるモータとを備え、……」という記載があった場合に、上記例の請求項における記述断片「送風手段と、」に対して、記述断片「羽根と、」、「モータと」が係るように表示してもよい。   In this example, a case has been described in which description fragments relating to constituent elements that share a common word stem are collected in one claim, but this may be performed in a dependent claim. For example, in a claim dependent on the claim of the above example, when there is a description that "... the air blowing means includes a blade and a motor that rotates the blade, ..." The description fragment “blade” and “motor” may be displayed with respect to the description fragment “with air blowing means” in the section.

なお、本実施の形態による請求項構造情報生成装置1において、親区切文節タイプや、子区切文節タイプを用いて、構成要素の親子関係を取得するようにしてもよい。その場合には、請求項構造情報生成装置1は、図11で示されるように、親子関係取得部21と、階層レベル取得部22とをさらに備えてもよい。   In the claim structure information generating apparatus 1 according to the present embodiment, the parent-child relationship between the constituent elements may be acquired using a parent-delimited clause type or a child-delimited clause type. In that case, the claim structure information generation device 1 may further include a parent-child relationship acquisition unit 21 and a hierarchy level acquisition unit 22, as shown in FIG.

親子関係取得部21は、親区切文節タイプと子区切文節タイプとの付与された特許請求項情報を用いて、構成要素の親子関係を取得する。具体的には、ある構成要素の包含関係を示すトークンに対する親区切文節タイプに対応する文節の構成要素は、親の構成要素であり、その同じトークンに対する子区切文節タイプに対応する文節の構成要素は、子の構成要素である。したがって、その構成要素の包含関係を示すトークンを介在させることによって、構成要素の親子関係を取得することができる。その親子関係は、例えば、親である画像形成装置に対応する子が、ダクト、送風手段、清浄化手段であることを示す情報であってもよい。この例のように、説明の便宜上、装置なども構成要素と呼ぶことにする。また、記述断片から構成要素を特定する方法は、前述の語幹を特定する方法と同様であり、その説明を省略する。その親子関係を示す情報は、図示しない記録媒体において記憶されてもよい。   The parent-child relationship acquisition unit 21 acquires the parent-child relationship of the constituent elements using the patent claim information to which the parent-delimited clause type and the child-delimited clause type are assigned. Specifically, the clause component corresponding to the parent delimiter clause type for a token indicating the inclusion relationship of a certain component is the parent component, and the clause component corresponding to the child delimiter clause type for the same token Is a child component. Therefore, the parent-child relationship of the component can be acquired by interposing a token indicating the inclusion relationship of the component. The parent-child relationship may be, for example, information indicating that the child corresponding to the parent image forming apparatus is a duct, a blowing unit, or a cleaning unit. As in this example, for convenience of explanation, an apparatus or the like is also referred to as a component. Further, the method for specifying the constituent element from the description fragment is the same as the method for specifying the word stem, and the description thereof is omitted. Information indicating the parent-child relationship may be stored in a recording medium (not shown).

階層レベル取得部22は、親子関係取得部21が取得した構成要素の親子関係を用いて、構成要素の階層レベルを取得する。親子関係から階層レベルを取得する方法は公知であるが、その一例を簡単に説明しておく。なお、ここでは、最も高い階層レベル(それに対する親の存在しない階層レベル)を「1」として、階層が深くなるほど、階層レベルの値が大きくなるものとする。まず、親子関係から、すべての構成要素を取得し、ユニーク処理を行う。そして、各構成要素のうち、親のない構成要素に対して、階層レベル1を付与する。その階層レベル1の構成要素を親に持つすべての構成要素に対して、階層レベル2を付与する。このように、階層レベルNの構成要素を親に持つすべての構成要素に対して、階層レベル(N+1)を付与する処理を、階層レベルの付与されていない構成要素がなくなるまで継続する。その結果、すべての構成要素の階層レベルを知ることができるようになる。その構成要素ごとの階層レベルを示す情報は、図示しない記録媒体において記憶されてもよい。   The hierarchy level acquisition unit 22 acquires the hierarchy level of the component using the parent-child relationship of the component acquired by the parent-child relationship acquisition unit 21. Although a method for acquiring a hierarchical level from a parent-child relationship is known, an example thereof will be briefly described. Here, it is assumed that the highest hierarchical level (hierarchical level for which no parent exists) is “1”, and the value of the hierarchical level increases as the hierarchy becomes deeper. First, all components are acquired from the parent-child relationship, and unique processing is performed. Then, a hierarchy level 1 is assigned to a component that does not have a parent among the components. Hierarchy level 2 is assigned to all the components having the hierarchy level 1 component as a parent. In this way, the process of assigning the hierarchy level (N + 1) to all the constituent elements having the constituent element of the hierarchical level N as a parent is continued until there is no constituent element to which no hierarchical level is assigned. As a result, it becomes possible to know the hierarchical level of all the constituent elements. Information indicating the hierarchical level for each component may be stored in a recording medium (not shown).

また、出力部20は、階層レベル取得部22が取得した階層レベルに応じて、親区切文節タイプ及び子区切文節タイプに対応する記述断片を表示してもよい。「階層レベルに応じて記述断片を表示する」とは、例えば、階層レベルを示す数値等を、記述断片に対応付けて表示することであってもよく、あるいは、階層レベルに応じた表示位置(例えば、階層レベルが高いほど左(または上)に表示され、階層レベルが低いほど右(または下)に表示されてもよい)となるように記述断片を表示することであってもよい。   In addition, the output unit 20 may display description fragments corresponding to the parent break phrase type and the child break phrase type according to the hierarchy level acquired by the hierarchy level acquisition unit 22. “Displaying a description fragment according to the hierarchy level” may be, for example, displaying a numerical value indicating the hierarchy level in association with the description fragment, or a display position ( For example, the description fragment may be displayed so that the higher the hierarchy level, the left (or upper) the display fragment may be displayed, and the lower the hierarchy level, the right (or lower) may be displayed.

ここで、具体例を用いて説明する。
なお、請求項構造情報が生成されるまでの処理は、前述の処理と同様であり、その説明を省略する。その請求項構造情報は、次の通りであるとする。
Here, it demonstrates using a specific example.
The process until the claim structure information is generated is the same as the process described above, and the description thereof is omitted. The claim structure information is as follows.

[請求項構造情報]
1 画像形成装置において、 JEPSON_CUE 14
2 外部に接続される VPK 3
3 ダクトと、 NPT_P 8
4 エアを排出する VPK 5
5 送風手段と、 NPT_P 8
6 エアを清浄化する VPK 7
7 清浄化手段と、 NPT_P 8
8 を備え、 COMPOSE_R_CUE 13
9 前記ダクトは NPH 13
10 内部ダクト NPT_P 11
11 を有し、 COMPOSE_R_CUE 9
12 前記清浄化手段は、前記内部ダクト内に設置されている、 VPK_P 13
13 ことを特徴とする FEATURE_K_CUE 14
14 画像形成装置。 BP
[Claim structure information]
1 In the image forming apparatus, JEPSON_CUE 14
2 VPK connected to outside 3
3 Duct and NPT_P 8
4 Discharge air VPK 5
5 blowing means and NPT_P 8
6 VPK to clean air 7
7 Cleaning means and NPT_P 8
8 and COMPOSE_R_CUE 13
9 The duct is NPH 13
10 Internal duct NPT_P 11
11 and COMPOSE_R_CUE 9
12 The cleaning means is installed in the internal duct, VPK_P 13
13 FEATURE_K_CUE 14
14 Image forming apparatus. BP

親子関係取得部21は、COMPOSE_K_CUEまたはCOMPOSE_R_CUEごとに、親子関係を取得するものとする。COMPOSE_K_CUEまたはCOMPOSE_R_CUEよりも前に、NPHまたはNPH_Pが存在する場合には、そのCOMPOSE_K_CUEまたはCOMPOSE_R_CUEに対する親の構成要素として、最も近いNPHまたはNPH_Pの語幹を取得する。また、そのCOMPOSE_K_CUEまたはCOMPOSE_R_CUEに係るNPT_Pの語幹を、子の構成要素として取得する。このようにして、親子関係を取得することができる。   The parent-child relationship acquisition unit 21 acquires a parent-child relationship for each COMPOSE_K_CUE or COMPOSE_R_CUE. If NPH or NPH_P exists before COMPOSE_K_CUE or COMPOSE_R_CUE, the nearest NPH or NPH_P stem is obtained as the parent component for that COMPOSE_K_CUE or COMPOSE_R_CUE. In addition, the NPT_P stem of the COMPOSE_K_CUE or COMPOSE_R_CUE is acquired as a child component. In this way, the parent-child relationship can be acquired.

また、COMPOSE_K_CUEまたはCOMPOSE_R_CUEよりも前に、NPHまたはNPH_Pが存在しない場合には、親子関係取得部21は、そのCOMPOSE_K_CUEまたはCOMPOSE_R_CUEに対する親の構成要素として、そのCOMPOSE_K_CUEまたはCOMPOSE_R_CUEの係り先の記述断片(他の記述断片を介した係り先の記述断片であってもよい)のうち、最も近いHPを含む記述断片(すなわち、そのHPを含むJEPSON_CUEの記述断片)またはBPの語幹を取得する。また、親子関係取得部21は、そのCOMPOSE_K_CUEまたはCOMPOSE_R_CUEに係るNPT_Pの語幹を、子の構成要素として取得する。このようにして、親子関係を取得することができる。   Further, when NPH or NPH_P does not exist before COMPOSE_K_CUE or COMPOSE_R_CUE, the parent-child relationship acquisition unit 21 uses the relationship of the COMPOSE_K_CUE or COMPOSE_R_CUE as the parent component for the COMPOSE_K_CUE or COMPOSE_R_CUE The description fragment including the closest HP (that is, the description fragment of JEPSON_CUE including the HP) or the stem of the BP is obtained. Further, the parent-child relationship acquisition unit 21 acquires the NPT_P stem associated with the COMPOSE_K_CUE or COMPOSE_R_CUE as a child component. In this way, the parent-child relationship can be acquired.

前述の請求項構造情報の場合には、親子関係取得部21は、例えば、記述断片「8 を備え、 COMPOSE_R_CUE 13」に対して、親の構成要素「画像形成装置」と、子の構成要素「ダクト」、「送風手段」、「清浄化手段」とを取得することができる。また、親子関係取得部21は、例えば、記述断片「11 を有し、 COMPOSE_R_CUE 9」に対して、親の構成要素「ダクト」と、子の構成要素「内部ダクト」とを取得することができる。したがって、その取得した親子関係を示す情報は、図12で示されるようになる。   In the case of the above-described claim structure information, the parent-child relationship acquisition unit 21 includes, for example, a description component “8, COMPOSE_R_CUE 13”, a parent component “image forming apparatus”, and a child component “ “Duct”, “Blowing means”, “Cleaning means” can be acquired. Further, the parent-child relationship acquisition unit 21 can acquire, for example, the parent component “duct” and the child component “internal duct” for the description fragment “11, COMPOSE_R_CUE 9”. . Therefore, the information indicating the acquired parent-child relationship is as shown in FIG.

階層レベル取得部22は、図12で示される親子関係から、例えば、前述の方法によって、各構成要素の階層レベルを次のように取得する。
構成要素 階層レベル
画像形成装置 1
ダクト 2
送風手段 2
清浄化手段 2
内部ダクト 3
The hierarchical level acquisition unit 22 acquires the hierarchical level of each component as follows from the parent-child relationship shown in FIG. 12, for example, by the method described above.
Component Hierarchy level Image forming device 1
Duct 2
Blowing means 2
Cleaning means 2
Internal duct 3

出力部20は、その構成要素と階層レベルとの対応を用いて、記述断片を表示する際に、その記述断片の語幹が、いずれかの構成要素と一致する場合には、その構成要素に対応する階層レベルの数値を記述断片の位置に表示する。その結果、図13の表示がなされることになる。このようにして、各構成要素の階層レベルをも表示することができ、それを見たユーザは、構成要素の階層レベルを容易に把握することができるようになる。なお、この例では、階層のレベルが深いほど数値が大きくなる階層レベルとしたが、逆であってもよい。すなわち、階層のレベルが深いほど数値が小さくなる階層レベルを採用してもよい。   When displaying the description fragment using the correspondence between the component and the hierarchy level, the output unit 20 corresponds to the component if the stem of the description fragment matches any component. The numerical value of the hierarchy level to be displayed is displayed at the position of the description fragment. As a result, the display of FIG. 13 is made. In this way, the hierarchical level of each component can also be displayed, and the user who sees it can easily understand the hierarchical level of the component. In this example, the hierarchical level is such that the numerical value increases as the hierarchical level increases. That is, a hierarchical level in which the numerical value decreases as the hierarchical level increases.

また、本実施の形態において、構成要素を含む記述断片(例えば、BP、NPT_P、NPH、NPH_P等の付与された記述断片)を表示する際には、その記述断片の語幹のみを表示するようにしてもよい。例えば、記述断片「画像形成装置。」に代えて、その語幹「画像形成装置」を表示してもよく、記述断片「前記ダクトは」に代えて、その語幹「ダクト」を表示してもよい。   In this embodiment, when displaying a description fragment including a constituent element (for example, a description fragment to which BP, NPT_P, NPH, NPH_P, etc.) is displayed, only the word stem of the description fragment is displayed. May be. For example, the stem “image forming apparatus” may be displayed instead of the description fragment “image forming apparatus”, and the stem “duct” may be displayed instead of the description fragment “the duct”. .

また、本実施の形態では、区切文節タイプの削除等のように、文節タイプの変更を行う場合について説明したが、そうでなくてもよい。文節タイプの変更を行わない場合には、請求項構造情報生成装置1は、区切文節タイプ変更部18を備えていなくてもよい。なお、文節タイプの変更を行わない場合であっても、あらかじめ規定されている特許請求項の構造を示す規則(例えば、文脈自由文法で記述された規則や、トークンや区切文節タイプの付与された記述断片の係り受け関係等)を適切なものにすることによって、文節タイプの変更を行った場合と同様の結果を得ることも可能である。   Further, in the present embodiment, a case has been described in which the phrase type is changed, such as deletion of the delimited phrase type, but this need not be the case. When the phrase type is not changed, the claim structure information generation device 1 may not include the delimiter phrase type change unit 18. Even if the clause type is not changed, rules indicating the structure of the claimed claim (for example, rules described in a context-free grammar, tokens or delimited clause types are added) It is also possible to obtain the same result as when the phrase type is changed by making the dependency relationship of the description fragment appropriate.

また、上記実施の形態において用いた具体的なルールや条件、情報等は、それらに限定されないことは言うまでもない。目的を実現できる範囲において、適宜、それらを変更してもよい。
また、上記実施の形態では、請求項構造情報生成装置1がスタンドアロンである場合について説明したが、請求項構造情報生成装置1は、スタンドアロンの装置であってもよく、サーバ・クライアントシステムにおけるサーバ装置であってもよい。後者の場合には、出力部は、通信回線を介して情報を出力してもよい。
Needless to say, the specific rules, conditions, information, and the like used in the above embodiments are not limited thereto. As long as the object can be realized, they may be appropriately changed.
Further, in the above embodiment, the case where the claim structure information generation device 1 is stand-alone has been described. However, the claim structure information generation device 1 may be a stand-alone device, or a server device in a server / client system. It may be. In the latter case, the output unit may output information via a communication line.

また、上記実施の形態において、各処理または各機能は、単一の装置または単一のシステムによって集中処理されることによって実現されてもよく、あるいは、複数の装置または複数のシステムによって分散処理されることによって実現されてもよい。   In the above embodiment, each process or each function may be realized by centralized processing by a single device or a single system, or may be distributedly processed by a plurality of devices or a plurality of systems. It may be realized by doing.

また、上記実施の形態において、各構成要素が実行する処理に関係する情報、例えば、各構成要素が受け付けたり、取得したり、選択したり、生成したり、送信したり、受信したりした情報や、各構成要素が処理で用いるしきい値や数式、アドレス等の情報等は、上記説明で明記していない場合であっても、図示しない記録媒体において、一時的に、あるいは長期にわたって保持されていてもよい。また、その図示しない記録媒体への情報の蓄積を、各構成要素、あるいは、図示しない蓄積部が行ってもよい。また、その図示しない記録媒体からの情報の読み出しを、各構成要素、あるいは、図示しない読み出し部が行ってもよい。   In the above embodiment, information related to processing executed by each component, for example, information received, acquired, selected, generated, transmitted, or received by each component In addition, information such as threshold values, mathematical formulas, addresses, etc. used by each component in processing is retained temporarily or over a long period of time on a recording medium (not shown) even when not explicitly stated in the above description. It may be. Further, the storage of information in the recording medium (not shown) may be performed by each component or a storage unit (not shown). Further, reading of information from the recording medium (not shown) may be performed by each component or a reading unit (not shown).

また、上記実施の形態において、各構成要素等で用いられる情報、例えば、各構成要素が処理で用いるしきい値やアドレス、各種の設定値等の情報がユーザによって変更されてもよい場合には、上記説明で明記していない場合であっても、ユーザが適宜、それらの情報を変更できるようにしてもよく、あるいは、そうでなくてもよい。それらの情報をユーザが変更可能な場合には、その変更は、例えば、ユーザからの変更指示を受け付ける図示しない受付部と、その変更指示に応じて情報を変更する図示しない変更部とによって実現されてもよい。その図示しない受付部による変更指示の受け付けは、例えば、入力デバイスからの受け付けでもよく、通信回線を介して送信された情報の受信でもよく、所定の記録媒体から読み出された情報の受け付けでもよい。   In the above embodiment, when information used by each component, for example, information such as a threshold value, an address, and various setting values used by each component may be changed by the user Even if it is not specified in the above description, the user may be able to change the information as appropriate, or it may not be. If the information can be changed by the user, the change is realized by, for example, a not-shown receiving unit that receives a change instruction from the user and a changing unit (not shown) that changes the information in accordance with the change instruction. May be. The change instruction received by the receiving unit (not shown) may be received from an input device, information received via a communication line, or information read from a predetermined recording medium, for example. .

また、上記実施の形態において、請求項構造情報生成装置1に含まれる2以上の構成要素が通信デバイスや入力デバイス等を有する場合に、2以上の構成要素が物理的に単一のデバイスを有してもよく、あるいは、別々のデバイスを有してもよい。   In the above embodiment, when two or more constituent elements included in the claim structure information generating apparatus 1 have a communication device, an input device, etc., the two or more constituent elements have a physically single device. Or you may have separate devices.

また、上記実施の形態において、各構成要素は専用のハードウェアにより構成されてもよく、あるいは、ソフトウェアにより実現可能な構成要素については、プログラムを実行することによって実現されてもよい。例えば、ハードディスクや半導体メモリ等の記録媒体に記録されたソフトウェア・プログラムをCPU等のプログラム実行部が読み出して実行することによって、各構成要素が実現され得る。なお、上記実施の形態における請求項構造情報生成装置1を実現するソフトウェアは、以下のようなプログラムである。つまり、このプログラムは、コンピュータを、特許請求項のテキストが区切られた記述断片と当該記述断片の構造とを示す請求項構造情報を生成する請求項構造情報生成装置として機能させるためのプログラムであって、特許請求項のテキストである特許請求項情報が記憶される記憶部で記憶されている特許請求項情報を形態素解析する形態素解析部、特許請求項情報の文節の区切位置を特定する文節特定部、特許請求項情報において、記述断片の区切となると共に記述断片間の関係を示す表層の手がかり情報と、表層の手がかり情報に対応するトークンとを有する表層区切情報が2以上記憶される表層区切情報記憶部で記憶されている表層の手かがり情報に該当する位置に、表層の手がかり情報に対応するトークンを付与するトークン付与部、特許請求項情報において、記述断片の区切となる文節の品詞の手がかり情報と、品詞の手がかり情報に対応する区切文節タイプとを有する文節タイプ対応情報が2以上記憶される文節タイプ対応情報記憶部で記憶されている品詞の手がかり情報に該当する文節に、品詞の手がかり情報に対応する区切文節タイプを付与する区切文節タイプ付与部、特許請求項情報に付与されたトークンと区切文節タイプとを用い、あらかじめ規定されている特許請求項の構造を示す規則に応じて、特許請求項情報の記述断片の構造を示す請求項構造情報を生成する生成部、生成部が生成した請求項構造情報を出力する出力部として機能させるためのものである。   In the above embodiment, each component may be configured by dedicated hardware, or a component that can be realized by software may be realized by executing a program. For example, each component can be realized by a program execution unit such as a CPU reading and executing a software program recorded on a recording medium such as a hard disk or a semiconductor memory. In addition, the software which implement | achieves the claim structure information generation apparatus 1 in the said embodiment is the following programs. In other words, this program is a program for causing a computer to function as a claim structure information generation device that generates claim structure information indicating a description fragment in which the text of a claim is delimited and the structure of the description fragment. A morpheme analyzer for morphological analysis of the claim information stored in the storage unit for storing the claim information which is the text of the claim, and a phrase specification for specifying the break position of the clause of the claim information Part, claim information, and a surface layer delimiter in which two or more surface layer delimiter information are stored that include descriptive fragment delimiters and surface layer clue information indicating the relationship between the descriptive fragments and a token corresponding to the surface layer clue information Token grant that grants a token corresponding to the surface clue information at a position corresponding to the surface clue information stored in the information storage unit In the claim information, a phrase type correspondence information storage unit that stores two or more phrase type correspondence information having clue information on the part of speech of the clause that is a delimiter of the description fragment and a segment phrase type corresponding to the clue information on the part of speech In the clause corresponding to the part-of-speech clue information stored in the above, a separator-phrase type assigning unit for assigning a clause-type corresponding to the part-of-speech clue information, a token and a clause-type specified in the claim information are used. , In accordance with a rule indicating the structure of a patent claim defined in advance, a generation unit for generating claim structure information indicating the structure of a description fragment of claim claim information, and outputting the claim structure information generated by the generation unit It is for functioning as an output unit.

なお、上記プログラムにおいて、上記プログラムが実現する機能には、ハードウェアでしか実現できない機能は含まれない。例えば、情報を出力する出力部などにおけるモデムやインターフェースカードなどのハードウェアでしか実現できない機能は、上記プログラムが実現する機能には少なくとも含まれない。   In the program, the functions realized by the program do not include functions that can be realized only by hardware. For example, a function that can be realized only by hardware such as a modem or an interface card in an output unit that outputs information is not included in at least the function realized by the program.

また、このプログラムは、サーバなどからダウンロードされることによって実行されてもよく、所定の記録媒体(例えば、CD−ROMなどの光ディスクや磁気ディスク、半導体メモリなど)に記録されたプログラムが読み出されることによって実行されてもよい。また、このプログラムは、プログラムプロダクトを構成するプログラムとして用いられてもよい。   Further, this program may be executed by being downloaded from a server or the like, and a program recorded on a predetermined recording medium (for example, an optical disk such as a CD-ROM, a magnetic disk, a semiconductor memory, or the like) is read out. May be executed by Further, this program may be used as a program constituting a program product.

また、このプログラムを実行するコンピュータは、単数であってもよく、複数であってもよい。すなわち、集中処理を行ってもよく、あるいは分散処理を行ってもよい。   Further, the computer that executes this program may be singular or plural. That is, centralized processing may be performed, or distributed processing may be performed.

図14は、上記プログラムを実行して、上記実施の形態による請求項構造情報生成装置1を実現するコンピュータの外観の一例を示す模式図である。上記実施の形態は、コンピュータハードウェア及びその上で実行されるコンピュータプログラムによって実現されうる。   FIG. 14 is a schematic diagram showing an example of an external appearance of a computer that executes the program and realizes the claim structure information generation device 1 according to the embodiment. The above-described embodiment can be realized by computer hardware and a computer program executed on the computer hardware.

図14において、コンピュータシステム900は、CD−ROM(Compact Disk Read Only Memory)ドライブ905、FD(Floppy(登録商標) Disk)ドライブ906を含むコンピュータ901と、キーボード902と、マウス903と、モニタ904とを備える。   14, a computer system 900 includes a computer 901 including a CD-ROM (Compact Disk Read Only Memory) drive 905 and an FD (Floppy (registered trademark) Disk) drive 906, a keyboard 902, a mouse 903, a monitor 904, and the like. Is provided.

図15は、コンピュータシステム900の内部構成を示す図である。図15において、コンピュータ901は、CD−ROMドライブ905、FDドライブ906に加えて、MPU(Micro Processing Unit)911と、ブートアッププログラム等のプログラムを記憶するためのROM912と、MPU911に接続され、アプリケーションプログラムの命令を一時的に記憶すると共に、一時記憶空間を提供するRAM(Random Access Memory)913と、アプリケーションプログラム、システムプログラム、及びデータを記憶するハードディスク914と、MPU911、ROM912等を相互に接続するバス915とを備える。なお、コンピュータ901は、LANへの接続を提供する図示しないネットワークカードを含んでいてもよい。   FIG. 15 is a diagram showing an internal configuration of the computer system 900. In FIG. 15, in addition to the CD-ROM drive 905 and the FD drive 906, a computer 901 is connected to an MPU (Micro Processing Unit) 911, a ROM 912 for storing a program such as a bootup program, and the MPU 911. A RAM (Random Access Memory) 913 that temporarily stores program instructions and provides a temporary storage space, a hard disk 914 that stores application programs, system programs, and data, and an MPU 911 and a ROM 912 are interconnected. And a bus 915. The computer 901 may include a network card (not shown) that provides connection to the LAN.

コンピュータシステム900に、上記実施の形態による請求項構造情報生成装置1の機能を実行させるプログラムは、CD−ROM921、またはFD922に記憶されて、CD−ROMドライブ905、またはFDドライブ906に挿入され、ハードディスク914に転送されてもよい。これに代えて、そのプログラムは、図示しないネットワークを介してコンピュータ901に送信され、ハードディスク914に記憶されてもよい。プログラムは実行の際にRAM913にロードされる。なお、プログラムは、CD−ROM921やFD922、またはネットワークから直接、ロードされてもよい。   A program for causing the computer system 900 to execute the function of the claimed structure information generating apparatus 1 according to the above-described embodiment is stored in the CD-ROM 921 or FD 922 and inserted into the CD-ROM drive 905 or FD drive 906. It may be transferred to the hard disk 914. Instead, the program may be transmitted to the computer 901 via a network (not shown) and stored in the hard disk 914. The program is loaded into the RAM 913 when executed. The program may be loaded directly from the CD-ROM 921, the FD 922, or the network.

プログラムは、コンピュータ901に、上記実施の形態による請求項構造情報生成装置1の機能を実行させるオペレーティングシステム(OS)、またはサードパーティプログラム等を必ずしも含んでいなくてもよい。プログラムは、制御された態様で適切な機能(モジュール)を呼び出し、所望の結果が得られるようにする命令の部分のみを含んでいてもよい。コンピュータシステム900がどのように動作するのかについては周知であり、詳細な説明は省略する。   The program does not necessarily include an operating system (OS), a third party program, or the like that causes the computer 901 to execute the functions of the claim structure information generation device 1 according to the above-described embodiment. The program may include only a part of an instruction that calls an appropriate function (module) in a controlled manner and obtains a desired result. How the computer system 900 operates is well known and will not be described in detail.

また、本発明は、以上の実施の形態に限定されることなく、種々の変更が可能であり、それらも本発明の範囲内に包含されるものであることは言うまでもない。   Further, the present invention is not limited to the above-described embodiment, and various modifications are possible, and it goes without saying that these are also included in the scope of the present invention.

以上より、本発明による請求項構造情報生成装置等によれば、より深い構造を持つ特許請求項についても、構造解析を行うことができるという効果が得られ、特許請求項を解析する装置等として有用である。   As described above, according to the claim structure information generating apparatus and the like according to the present invention, an effect that a structure analysis can be performed on a claim having a deeper structure can be obtained. Useful.

1 請求項構造情報生成装置
11 記憶部
12 形態素解析部
13 文節特定部
14 表層区切情報記憶部
15 トークン付与部
16 文節タイプ対応情報記憶部
17 区切文節タイプ付与部
18 区切文節タイプ変更部
19 生成部
20 出力部
21 親子関係取得部
22 階層レベル取得部
DESCRIPTION OF SYMBOLS 1 Claim structure information production | generation apparatus 11 Memory | storage part 12 Morphological analysis part 13 Clause specific part 14 Surface layer division | segmentation information storage part 15 Token provision part 16 Phrase type corresponding | compatible information storage part 17 Separation phrase type provision part 18 Separation phrase type change part 19 Generation part 20 Output unit 21 Parent-child relationship acquisition unit 22 Hierarchy level acquisition unit

Claims (10)

特許請求項のテキストが区切られた記述断片と当該記述断片の構造とを示す請求項構造情報を生成する請求項構造情報生成装置であって、
特許請求項のテキストである特許請求項情報が記憶される記憶部と、
前記特許請求項情報を形態素解析する形態素解析部と、
前記特許請求項情報の文節の区切位置を特定する文節特定部と、
記述断片の区切となると共に記述断片間の関係を示す表層の手がかり情報と、当該表層の手がかり情報に対応するトークンとを有する表層区切情報が2以上記憶される表層区切情報記憶部と、
前記特許請求項情報において、表層の手かがり情報に該当する位置に、当該表層の手がかり情報に対応するトークンを付与するトークン付与部と、
記述断片の区切となる文節の品詞の手がかり情報と、当該品詞の手がかり情報に対応する区切文節タイプとを有する文節タイプ対応情報が2以上記憶される文節タイプ対応情報記憶部と、
前記特許請求項情報において、品詞の手がかり情報に該当する文節に、当該品詞の手がかり情報に対応する区切文節タイプを付与する区切文節タイプ付与部と、
前記特許請求項情報に付与されたトークンと区切文節タイプとを用い、あらかじめ規定されている特許請求項の構造を示す規則に応じて、前記特許請求項情報の記述断片の構造を示す請求項構造情報を生成する生成部と、
前記生成部が生成した請求項構造情報を出力する出力部と、を備え
前記生成部は、
文脈自由文法で記述されたトークン及び区切文節タイプに関する規則と、当該規則に対応する構造を前記特許請求項情報に付与するアクションとを有する文法ファイルを用いて生成された構文解析器を用いて、前記特許請求項情報に対応する請求項構造情報を生成する、請求項構造情報生成装置。
A claim structure information generating device for generating claim structure information indicating a description fragment in which a text of a claim is delimited and a structure of the description fragment,
A storage unit for storing claim information which is a text of a claim;
A morpheme analysis unit for morphological analysis of the claim information;
A phrase specifying unit for specifying a section position of the clause of the claim information;
A surface layer delimiter information storage unit for storing two or more surface layer delimiter information including delimiters of description fragments and surface layer clue information indicating a relationship between the description fragments, and a token corresponding to the surface layer clue information;
In the claim information, a token granting unit for granting a token corresponding to the surface clue information at a position corresponding to the surface clue information,
A phrase type correspondence information storage unit for storing two or more phrase type correspondence information having clue information on the part of speech of a clause that is a delimiter of a description fragment and a segment clause type corresponding to the clue information on the part of speech;
In the claim information, a delimiter clause type giving unit that gives a delimiter clause type corresponding to the clue information of the part of speech to a clause corresponding to the clue information of the part of speech,
A claim structure indicating a structure of a description fragment of the claim information according to a rule indicating a structure of the claim, which is defined in advance, using a token and a delimiter clause type given to the claim information. A generator for generating information;
An output unit that outputs claim structure information generated by the generation unit , and
The generator is
Using a parser generated using a grammar file having rules relating to tokens and delimited clause types described in a context-free grammar and an action for assigning a structure corresponding to the rules to the claim information, A claim structure information generation device that generates claim structure information corresponding to the claim information.
記述断片の区切の並びに応じて、記述断片の区切でない位置に存在する区切文節タイプを削除する区切文節タイプ変更部をさらに備え、
前記生成部は、前記区切文節タイプ変更部が区切文節タイプを削除した後に請求項構造情報を生成し、
前記区切文節タイプ変更部は、
並列する記述断片の終端の区切文節タイプである終端区切文節タイプと、当該終端区切文節タイプより以前の、並列する記述断片が継続しうる区切文節タイプである継続区切文節タイプとの間に終端区切文節タイプが存在する場合に、両区切文節タイプの間に存在する当該終端区切文節タイプを削除する、請求項1記載の請求項構造情報生成装置。
A delimiter clause type changing unit that deletes delimiter clause types existing at positions that are not delimiters of the descriptive fragment according to the sequence of descriptive fragments,
The generation unit generates claim structure information after the delimiter clause type change unit deletes the delimiter clause type ,
The delimiter clause type change part is:
Termination delimiter between a delimiter clause type that is the delimiter clause type at the end of parallel description fragments and a continuation delimiter clause type that is a delimiter clause type that can be continued by parallel descriptive fragments before the terminal delimiter clause type The claim structure information generating device according to claim 1, wherein when a clause type exists, the terminal break clause type existing between both break clause types is deleted .
記述断片の区切の並びに応じて、記述断片の区切でない位置に存在する区切文節タイプを削除する区切文節タイプ変更部をさらに備え、
前記生成部は、前記区切文節タイプ変更部が区切文節タイプを削除した後に請求項構造情報を生成し、
前記区切文節タイプ変更部は、
改行が存在する場合であって、改行が後続しない動詞に関する区切文節タイプが存在する場合に、当該区切文節タイプを削除する、請求項記載の請求項構造情報生成装置。
A delimiter clause type changing unit that deletes delimiter clause types existing at positions that are not delimiters of the descriptive fragment according to the sequence of descriptive fragments,
The generation unit generates claim structure information after the delimiter clause type change unit deletes the delimiter clause type,
The delimiter clause type change part is:
The claim structure information generation device according to claim 1 , wherein when there is a line break and there is a line break type related to a verb not followed by a line break, the line break type is deleted.
特許請求項の構造の文脈自由文法による記述が特許請求項の終端から先頭への方向で記述されており、
前記生成部は、
トークン及び区切文節タイプの付与された前記特許請求項情報を終端から先頭への方向で取り込むことによって請求項構造情報を生成する、請求項1から請求項3のいずれか記載の請求項構造情報生成装置。
A description in the context-free grammar of the structure of the claim is written in the direction from the end to the beginning of the claim,
The generator is
The claim structure information generation according to any one of claims 1 to 3 , wherein the claim structure information is generated by taking in the claim information to which a token and a delimiter clause type are attached in a direction from a terminal to a head. apparatus.
前記生成部は、
前記特許請求項情報に、前記文法ファイルに含まれる規則に対応した構造を示すマークを付与することによって、マークアップ言語を用いて記述された請求項構造情報を生成する、請求項1から請求項4のいずれか記載の請求項構造情報生成装置。
The generator is
Claim structure information described using a markup language is generated by adding a mark indicating a structure corresponding to a rule included in the grammar file to the claim information. 5. The structure information generating device according to claim 4 .
前記出力部は、
前記生成部が生成した請求項構造情報を、記述断片間の関係が分かるように表示する、請求項1から請求項のいずれか記載の請求項構造情報生成装置。
The output unit is
The claim structure information generating apparatus according to any one of claims 1 to 5 , wherein the claim structure information generated by the generation unit is displayed so that a relationship between description fragments can be understood.
トークンには、構成要素の包含関係に応じたトークンが存在し、
区切文節タイプには、
構成要素の包含関係を示すトークンに対して、親の構成要素に応じた区切文節タイプである親区切文節タイプと、
構成要素の包含関係を示すトークンに対して、子の構成要素に応じた区切文節タイプである子区切文節タイプと、が存在し、
前記出力部は、親区切文節タイプに対応する記述断片と、子区切文節タイプに対応する記述断片との親子関係が分かるように両記述断片を表示する、請求項記載の請求項構造情報生成装置。
Tokens exist according to the inclusion relationship of components,
For delimiter clause types,
For tokens that indicate the inclusion relationship of components, a parent delimiter clause type that is a delimiter clause type according to the parent component,
There is a child delimiter clause type, which is a delimiter clause type corresponding to the child component, for the token indicating the inclusion relationship of the component,
7. The structure information generation according to claim 6 , wherein the output unit displays both description fragments so that a parent-child relationship between a description fragment corresponding to a parent-delimited clause type and a description fragment corresponding to a child-delimited clause type can be understood. apparatus.
親区切文節タイプと子区切文節タイプとの付与された前記特許請求項情報を用いて、構成要素の親子関係を取得する親子関係取得部と、
前記親子関係取得部が取得した構成要素の親子関係を用いて、構成要素の階層レベルを取得する階層レベル取得部と、を備え、
前記出力部は、前記階層レベル取得部が取得した階層レベルに応じて、親区切文節タイプ及び子区切文節タイプに対応する記述断片を表示する、請求項記載の請求項構造情報生成装置。
A parent-child relationship acquisition unit for acquiring a parent-child relationship of the constituent elements using the claim information to which a parent-delimited clause type and a child-delimited clause type are attached;
A hierarchy level acquisition unit that acquires the hierarchy level of the component using the parent-child relationship of the component acquired by the parent-child relationship acquisition unit, and
8. The structure information generating apparatus according to claim 7 , wherein the output unit displays a description fragment corresponding to a parent delimiter clause type and a child delimiter clause type according to the hierarchy level acquired by the hierarchy level acquisition unit.
特許請求項のテキストである特許請求項情報が記憶される記憶部と、形態素解析部と、文節特定部と、特許請求項のテキストにおける記述断片の区切となると共に記述断片間の関係を示す表層の手がかり情報と、当該表層の手がかり情報に対応するトークンとを有する表層区切情報が2以上記憶される表層区切情報記憶部と、トークン付与部と、記述断片の区切となる文節の品詞の手がかり情報と、当該品詞の手がかり情報に対応する区切文節タイプとを有する文節タイプ対応情報が2以上記憶される文節タイプ対応情報記憶部と、区切文節タイプ付与部と、生成部と、出力部とを用いて処理される、特許請求項のテキストが区切られた記述断片と当該記述断片の構造とを示す請求項構造情報を生成する請求項構造情報生成方法であって、
前記形態素解析部が、前記特許請求項情報を形態素解析する形態素解析ステップと、
前記文節特定部が、前記特許請求項情報の文節の区切位置を特定する文節特定ステップと、
前記トークン付与部が、前記特許請求項情報において、表層の手かがり情報に該当する位置に、当該表層の手がかり情報に対応するトークンを付与するトークン付与ステップと、
前記区切文節タイプ付与部が、前記特許請求項情報において、品詞の手がかり情報に該当する文節に、当該品詞の手がかり情報に対応する区切文節タイプを付与する区切文節タイプ付与ステップと、
前記生成部が、前記特許請求項情報に付与されたトークンと区切文節タイプとを用い、あらかじめ規定されている特許請求項の構造を示す規則に応じて、前記特許請求項情報の記述断片の構造を示す請求項構造情報を生成する生成ステップと、
前記出力部が、前記生成ステップで生成した請求項構造情報を出力する出力ステップと、を備え
前記生成ステップでは、
文脈自由文法で記述されたトークン及び区切文節タイプに関する規則と、当該規則に対応する構造を前記特許請求項情報に付与するアクションとを有する文法ファイルを用いて生成された構文解析器を用いて、前記特許請求項情報に対応する請求項構造情報を生成する、請求項構造情報生成方法。
A storage unit for storing claim information, which is a text of a claim, a morpheme analysis unit, a phrase specifying unit, and a surface layer indicating a relationship between the description fragments in the claim text Clue information and a part-of-speech clue information of a clause serving as a delimiter for a description fragment, a surface layer delimiter information storage unit storing two or more surface layer delimiter information having tokens corresponding to the surface layer clue information And a phrase type correspondence information storage unit that stores two or more phrase type correspondence information having a segmentation phrase type corresponding to the clue information of the part of speech, a segmentation phrase type giving unit, a generation unit, and an output unit Claim structure information generating method for generating claim structure information indicating a description fragment and a structure of the description fragment, which are processed by
The morpheme analysis unit performs a morpheme analysis step for morphological analysis of the claim information;
The phrase specifying unit for specifying the position where the clause of the claim information is separated;
In the claim information, the token granting unit grants a token corresponding to the surface clue information at a position corresponding to the surface clue information; and
In the claim information, the demarcation phrase type giving unit assigns a demarcation phrase type corresponding to the part-of-speech clue information to a phrase corresponding to the part-of-speech clue information; and
Structure of description fragment of claim information according to a rule indicating a structure of claim according to a predetermined rule, wherein the generation unit uses a token and a delimiter clause type given to the claim information. Generating a claim structure information indicating:
An output step for outputting the claim structure information generated in the generation step ;
In the generating step,
Using a parser generated using a grammar file having rules relating to tokens and delimited clause types described in a context-free grammar and an action for assigning a structure corresponding to the rules to the claim information, A claim structure information generation method for generating claim structure information corresponding to the claim information.
コンピュータを、
特許請求項のテキストが区切られた記述断片と当該記述断片の構造とを示す請求項構造情報を生成する請求項構造情報生成装置として機能させるためのプログラムであって、
特許請求項のテキストである特許請求項情報が記憶される記憶部で記憶されている特許請求項情報を形態素解析する形態素解析部、
前記特許請求項情報の文節の区切位置を特定する文節特定部、
前記特許請求項情報において、記述断片の区切となると共に記述断片間の関係を示す表層の手がかり情報と、当該表層の手がかり情報に対応するトークンとを有する表層区切情報が2以上記憶される表層区切情報記憶部で記憶されている表層の手かがり情報に該当する位置に、当該表層の手がかり情報に対応するトークンを付与するトークン付与部、
前記特許請求項情報において、記述断片の区切となる文節の品詞の手がかり情報と、当該品詞の手がかり情報に対応する区切文節タイプとを有する文節タイプ対応情報が2以上記憶される文節タイプ対応情報記憶部で記憶されている品詞の手がかり情報に該当する文節に、当該品詞の手がかり情報に対応する区切文節タイプを付与する区切文節タイプ付与部、
前記特許請求項情報に付与されたトークンと区切文節タイプとを用い、あらかじめ規定されている特許請求項の構造を示す規則に応じて、前記特許請求項情報の記述断片の構造を示す請求項構造情報を生成する生成部、
前記生成部が生成した請求項構造情報を出力する出力部として機能させ
前記生成部は、
文脈自由文法で記述されたトークン及び区切文節タイプに関する規則と、当該規則に対応する構造を前記特許請求項情報に付与するアクションとを有する文法ファイルを用いて生成された構文解析器を用いて、前記特許請求項情報に対応する請求項構造情報を生成する、プログラム。
Computer
A program for functioning as a claim structure information generation device for generating claim structure information indicating a description fragment in which a text of a claim is delimited and a structure of the description fragment,
A morpheme analysis unit that performs morphological analysis on claim information stored in a storage unit that stores claim information that is a text of a claim,
A phrase specifying unit for specifying a section position of the clause of the claim information;
In the claim information, a surface layer delimiter in which two or more surface layer delimiter information including a surface layer clue information indicating a relationship between the description fragments and a token corresponding to the surface layer clue information is stored. A token grant unit that grants a token corresponding to the surface clue information at a position corresponding to the surface clue information stored in the information storage unit;
In the claim information, the phrase type correspondence information storage in which two or more phrase type correspondence information having clue information on the part of speech of the clause serving as a delimiter of the description fragment and a break phrase type corresponding to the clue information on the part of speech are stored. A delimiter-phrase type assigning unit that adds a delimiter-phrase type corresponding to the clue information of the part of speech to the clause corresponding to the clue information of the part of speech stored in the part,
A claim structure indicating a structure of a description fragment of the claim information according to a rule indicating a structure of the claim, which is defined in advance, using a token and a delimiter clause type given to the claim information. A generator for generating information,
Function as an output unit that outputs claim structure information generated by the generation unit ;
The generator is
Using a parser generated using a grammar file having rules relating to tokens and delimited clause types described in a context-free grammar and an action for assigning a structure corresponding to the rules to the claim information, A program for generating claim structure information corresponding to the claim information .
JP2010137876A 2010-06-17 2010-06-17 Claim structure information generation apparatus, claim structure information generation method, and program Expired - Fee Related JP5489872B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010137876A JP5489872B2 (en) 2010-06-17 2010-06-17 Claim structure information generation apparatus, claim structure information generation method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010137876A JP5489872B2 (en) 2010-06-17 2010-06-17 Claim structure information generation apparatus, claim structure information generation method, and program

Publications (2)

Publication Number Publication Date
JP2012003517A JP2012003517A (en) 2012-01-05
JP5489872B2 true JP5489872B2 (en) 2014-05-14

Family

ID=45535421

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010137876A Expired - Fee Related JP5489872B2 (en) 2010-06-17 2010-06-17 Claim structure information generation apparatus, claim structure information generation method, and program

Country Status (1)

Country Link
JP (1) JP5489872B2 (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6114090B2 (en) * 2013-03-29 2017-04-12 株式会社エヌ・ティ・ティ・データ Machine translation apparatus, machine translation method and program
JP6647713B2 (en) 2016-06-03 2020-02-14 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation Extract keywords in claims
KR102181677B1 (en) * 2018-12-18 2020-11-24 (주)아이브릭스 Method and apparatus for structuring patent claims
US12147770B2 (en) 2019-12-20 2024-11-19 Resonac Corporation Information processing device, reading comprehension support method, and program

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4289871B2 (en) * 2002-11-11 2009-07-01 株式会社インテックシステム研究所 Rhetorical structure analysis method for patent claims, rhetorical structure analysis program for patent claims, and rhetorical structure analysis system for claims
WO2009041661A1 (en) * 2007-09-28 2009-04-02 Intellectual Property Bank Corp. Information processing apparatus, and program

Also Published As

Publication number Publication date
JP2012003517A (en) 2012-01-05

Similar Documents

Publication Publication Date Title
US6023760A (en) Modifying an input string partitioned in accordance with directionality and length constraints
CN102479252B (en) Query expression conversion apparatus and query expression conversion method
JP2007323671A (en) Word segmentation in chinese text
JP2002259429A (en) Computer-based matching text search system and method
JP2007287134A (en) Information extraction apparatus and information extraction method
JP5100770B2 (en) Word classification method in kanji sentences
JP5489872B2 (en) Claim structure information generation apparatus, claim structure information generation method, and program
JP5291351B2 (en) Evaluation expression extraction method, evaluation expression extraction device, and evaluation expression extraction program
JP4900158B2 (en) Search system, method and program
JP2019121164A (en) Document creating apparatus, document creating method, database construction apparatus, database construction method, and program
JP5447368B2 (en) NEW CASE GENERATION DEVICE, NEW CASE GENERATION METHOD, AND NEW CASE GENERATION PROGRAM
JP3908261B2 (en) Rhetorical structure analysis system
JP4646328B2 (en) Related information extraction apparatus and method
JP5430238B2 (en) Information processing apparatus, information processing method, and program
JP5621145B2 (en) Document check device, document check program, and document check method
US12333245B2 (en) Methods and apparatus to improve disambiguation and interpretation in automated text analysis using structured language space and transducers applied on automatons
JPH07210556A (en) Natural language processing device and natural language processing method
CN103324653A (en) Main point extraction device and main point extraction method
JP6114090B2 (en) Machine translation apparatus, machine translation method and program
JPH0877196A (en) Document information extraction device
JP4155970B2 (en) Information processing apparatus, synonym database generation method, and synonym database generation program
JP2007219620A (en) Text retrieval device, program, and method
JP2019028659A (en) Data processing apparatus, data processing method, and data processing program
JP5142395B2 (en) Related information extraction apparatus, method, program, and recording medium
Neme An arabic language resource for computational morphology based on the semitic model

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130121

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131118

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131120

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131227

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140212

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140225

R150 Certificate of patent or registration of utility model

Ref document number: 5489872

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees