JP5489872B2 - Claim structure information generation apparatus, claim structure information generation method, and program - Google Patents
Claim structure information generation apparatus, claim structure information generation method, and program Download PDFInfo
- Publication number
- JP5489872B2 JP5489872B2 JP2010137876A JP2010137876A JP5489872B2 JP 5489872 B2 JP5489872 B2 JP 5489872B2 JP 2010137876 A JP2010137876 A JP 2010137876A JP 2010137876 A JP2010137876 A JP 2010137876A JP 5489872 B2 JP5489872 B2 JP 5489872B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- delimiter
- clause
- type
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Description
本発明は、特許請求項の構造に関する情報である請求項構造情報を生成する請求項構造情報生成装置等に関する。 The present invention relates to a claim structure information generating apparatus and the like for generating claim structure information which is information related to the structure of a claim.
特許出願の対象書類である「特許請求の範囲」に記述される特許請求項は、通常、長文かつ独特の記述スタイルで記述されるため、専門家以外の人にとっては極めて読みにくいものになっている。これに対して、実際の特許請求項の記述で多用される、いくつかの定型的表現を手がかりとして構造解析を行う手法が提案されている(例えば、特許文献1、特許文献2、非特許文献1参照)。また、特許請求項に記述されている内容を簡易に把握して記憶しやすくするための縮約表現手法も提案されている(例えば、特許文献3参照)。
The claims described in “Claims”, which are the subject documents of patent applications, are usually written in a long and unique description style, which makes it extremely difficult for non-experts to read. Yes. On the other hand, a method of performing structural analysis using some fixed expressions often used in the description of actual patent claims has been proposed (for example,
しかしながら、前述の特許文献1,2、非特許文献1は、特許請求項のトップレベルの構造を解析するものであり、より深い構造を持つ特許請求項については、構造解析がなされなかった。例えば、次のような特許請求項について、それらの提案手法を用いた場合には、図16で示されるように構造解析が行われ、「外部に接続されるダクトと、エアを排出する送風手段と、エアを清浄化する清浄化手段と、を備え、」の部分については、何ら解析が行われていなかった。
However,
[請求項]
画像形成装置において、
外部に接続されるダクトと、
エアを排出する送風手段と、
エアを清浄化する清浄化手段と、を備え、
前記ダクトは内部ダクトを有し、
前記清浄化手段は、前記内部ダクト内に設置されている、
ことを特徴とする画像形成装置。
[Claims]
In the image forming apparatus,
A duct connected to the outside;
Air blowing means for discharging air;
A cleaning means for cleaning air,
The duct has an internal duct;
The cleaning means is installed in the internal duct,
An image forming apparatus.
また、前述の特許文献3は、「発明を構成する要素」を抽出し、その説明部分を削除するものであり、特許請求項の構造を解析するものではない。
Further, the above-mentioned
本発明は、上記のような状況に応じてなされたものであり、より深い構造を持つ特許請求項についても、構造解析を行うことができる請求項構造情報生成装置等を提供することを目的とする。 The present invention has been made in accordance with the above situation, and an object of the present invention is to provide a claim structure information generation device and the like that can perform structural analysis on a claim having a deeper structure. To do.
上記目的を達成するため、本発明による請求項構造情報生成装置は、特許請求項のテキストが区切られた記述断片と当該記述断片の構造とを示す請求項構造情報を生成する請求項構造情報生成装置であって、特許請求項のテキストである特許請求項情報が記憶される記憶部と、特許請求項情報を形態素解析する形態素解析部と、特許請求項情報の文節の区切位置を特定する文節特定部と、記述断片の区切となると共に記述断片間の関係を示す表層の手がかり情報と、表層の手がかり情報に対応するトークンとを有する表層区切情報が2以上記憶される表層区切情報記憶部と、特許請求項情報において、表層の手かがり情報に該当する位置に、表層の手がかり情報に対応するトークンを付与するトークン付与部と、記述断片の区切となる文節の品詞の手がかり情報と、品詞の手がかり情報に対応する区切文節タイプとを有する文節タイプ対応情報が2以上記憶される文節タイプ対応情報記憶部と、特許請求項情報において、品詞の手がかり情報に該当する文節に、品詞の手がかり情報に対応する区切文節タイプを付与する区切文節タイプ付与部と、特許請求項情報に付与されたトークンと区切文節タイプとを用い、あらかじめ規定されている特許請求項の構造を示す規則に応じて、特許請求項情報の記述断片の構造を示す請求項構造情報を生成する生成部と、生成部が生成した請求項構造情報を出力する出力部と、を備えたものである。 To achieve the above object, a claim structure information generating apparatus according to the present invention generates claim structure information that generates claim structure information indicating a description fragment in which a text of a claim is delimited and a structure of the description fragment. A storage unit for storing claim information that is a text of a claim, a morpheme analysis unit that performs morpheme analysis on the claim information, and a clause that specifies a position where a clause of the claim information is separated A surface layer delimiter information storage unit for storing two or more surface layer delimiter information having a specific part, surface layer clue information indicating delimitation of description fragments and indicating a relationship between the description fragments, and a token corresponding to the surface layer clue information; In the claim information, at a position corresponding to the clue information on the surface layer, a token granting unit that assigns a token corresponding to the clue information on the surface layer, and a clause that delimits the description fragment Corresponding to part-of-speech clue information in the phrase-type correspondence information storage unit for storing at least two clause-type correspondence information having clue information on lyrics and a segmental clause type corresponding to the part-of-speech clue information, and claim information The structure of a claim defined in advance by using a delimiter clause type assigning section for assigning a delimiter clause type corresponding to the clue information of the part of speech to the clause, and a token and a delimiter clause type given to the claim information In accordance with the rules for indicating the claim structure, a generation unit that generates the claim structure information indicating the structure of the description fragment of the claim claim information, and an output unit that outputs the claim structure information generated by the generation unit is there.
このような構成により、表層及び品詞の手がかり情報と特許請求項の構造を示す規則とを用いることによって、特許請求項に含まれる記述断片の構造を検出することができる。また、文節単位で解析を行うことにより、従来例のように形態素ごとに解析を行っていた場合よりもより詳細なレベルで解析を行うことができるようになる。その結果、深い階層の構造をも解析することができるようになる。 With such a configuration, the structure of the description fragment included in the claim can be detected by using the clue information of the surface layer and the part of speech and the rule indicating the structure of the claim. Further, by performing analysis in units of phrases, it becomes possible to perform analysis at a more detailed level than in the case where analysis is performed for each morpheme as in the conventional example. As a result, a deep hierarchical structure can be analyzed.
また、本発明による請求項構造情報生成装置では、記述断片の区切の並びに応じて、記述断片の区切でない位置に存在する区切文節タイプを削除する区切文節タイプ変更部をさらに備え、生成部は、区切文節タイプ変更部が区切文節タイプを削除した後に請求項構造情報を生成してもよい。 The claim structure information generating apparatus according to the present invention further includes a delimiter clause type changing unit that deletes a delimiter clause type existing at a position that is not a delimiter of the description fragment in accordance with the delimiter of the description fragment, and the generation unit includes: Claim structure information may be generated after the delimiter clause type changing unit deletes the delimiter clause type.
このような構成により、記述断片の区切の並びに応じて、区切文節タイプを変更することができ、より適切な構造解析を行うことができるようになる。例えば、表層や品詞の手がかり情報を用いた区切位置の検出のみでは、形式的な区切位置をも検出してしまうことになりうるが、この区切文節タイプ変更部による区切文節タイプの削除を行うことによって、不適切な区切位置を削除することができ、より高精度な解析を実現することができる。 With such a configuration, the delimiter clause type can be changed in accordance with the arrangement of descriptive fragments, and more appropriate structural analysis can be performed. For example, only the detection of the break position using the surface layer and part-of-speech clue information can also detect the formal break position, but this break phrase type change section should delete the break phrase type. Thus, an inappropriate break position can be deleted, and a more accurate analysis can be realized.
また、本発明による請求項構造情報生成装置では、区切文節タイプ変更部は、並列する記述断片の終端の区切文節タイプである終端区切文節タイプと、終端区切文節タイプより以前の、並列する記述断片が継続しうる区切文節タイプである継続区切文節タイプとの間に終端区切文節タイプが存在する場合に、両区切文節タイプの間に存在する終端区切文節タイプを削除してもよい。 In the claim structure information generating device according to the present invention, the delimiter clause type change unit includes a delimiter clause type that is a delimiter clause type at the end of the parallel descriptive fragment, and a description fragment that is in parallel before the terminal delimiter clause type. When there is a terminal delimiter clause type between a delimiter clause type that can be continued, a terminal delimiter clause type existing between both delimiter clause types may be deleted.
このような構成により、一つの記述断片に含まれる小休止的な終端区切文節タイプを削除することができ、区切位置を適切にすることができる。例えば、特許請求項に「……し、……し、……し、……することを特徴とする」という記述や、「……と、……と、……と、……を備え、」という記述が存在した場合に、その「……」の部分に「する」が含まれたとしても、それは「……し、」や「……と、」等の中の小休止的な区切であって、記述断片の区切ではないと考えられるため、その「する」に対応する終端区切文節タイプを削除することになる。 With such a configuration, it is possible to delete a short break terminal delimiter clause type included in one description fragment and to make the delimiter position appropriate. For example, a claim is provided with a description “characterized by ………,…, ………,…”, “…,…,…,…, If there is a description of “”, even if “……” is included in the part of “……”, it is a short break in “……”, “...”, etc. Since it is considered not to be a delimiter of the description fragment, the terminal delimiter clause type corresponding to “Yes” is deleted.
また、本発明による請求項構造情報生成装置では、区切文節タイプ変更部は、改行が存在する場合であって、改行が後続しない動詞に関する区切文節タイプが存在する場合に、区切文節タイプを削除してもよい。
このような構成により、強力な区切である改行が後続しない動詞に関する区切文節タイプを削除することができ、区切位置を適切にすることができる。
In the claim structure information generating device according to the present invention, the delimiter clause type changing unit deletes the delimiter clause type when there is a newline and there is a delimiter clause type related to a verb not followed by a newline. May be.
With such a configuration, it is possible to delete a delimiter clause type related to a verb that is not followed by a new line that is a strong delimiter, and an appropriate delimiter position.
また、本発明による請求項構造情報生成装置では、生成部は、文脈自由文法で記述されたトークン及び区切文節タイプに関する規則と、規則に対応する構造を特許請求項情報に付与するアクションとを有する文法ファイルを用いて生成された構文解析器を用いて、特許請求項情報に対応する請求項構造情報を生成してもよい。 In the claim structure information generation device according to the present invention, the generation unit has rules relating to tokens and delimiter clause types described in a context-free grammar, and an action for assigning a structure corresponding to the rules to the claim information. Claim structure information corresponding to the claim information may be generated using a parser generated using a grammar file.
このような構成により、文法ファイルを用いて生成された構文解析器を用いることによって、トークンや区切文節タイプの付与された特許請求項情報から、特許請求項の構造を解析した請求項構造情報を生成することができる。 With such a configuration, by using a syntax analyzer generated by using a grammar file, the claim structure information obtained by analyzing the structure of the claim from the claim information to which the token or the demarcation clause type is assigned. Can be generated.
また、本発明による請求項構造情報生成装置では、特許請求項の構造の文脈自由文法による記述が特許請求項の終端から先頭への方向で記述されており、生成部は、トークン及び区切文節タイプの付与された特許請求項情報を終端から先頭への方向で取り込むことによって請求項構造情報を生成してもよい。 Further, in the claim structure information generating apparatus according to the present invention, the description in the context free grammar of the structure of the claim is described in the direction from the end to the beginning of the claim, and the generation unit includes the token and delimiter clause type. Claim structure information may be generated by fetching the appended claim information in the direction from the end to the beginning.
特許請求項では、終端に定型的な表現が存在し、その終端から先頭の方向で構造が確定するため、このような構成により、文法のあいまいさに起因する問題の発生を回避することができうる。例えば、shift/reduce conflictや、reduce/reduce conflictといった曖昧性を回避することができる。 In the claims, there is a typical expression at the end, and the structure is determined in the direction from the end to the beginning. Therefore, such a configuration can avoid the occurrence of problems caused by grammatical ambiguity. sell. For example, ambiguities such as shift / reduce conflict and reduce / reduce conflict can be avoided.
また、本発明による請求項構造情報生成装置では、生成部は、特許請求項情報に、文法ファイルに含まれる規則に対応した構造を示すマークを付与することによって、マークアップ言語を用いて記述された請求項構造情報を生成してもよい。
このような構成により、請求項構造情報を、例えば、XMLなどのマークアップ言語を用いて記述することができる。
In the claim structure information generating apparatus according to the present invention, the generating unit is described using a markup language by adding a mark indicating a structure corresponding to a rule included in the grammar file to the claim information. Claim structure information may be generated.
With this configuration, the claim structure information can be described using a markup language such as XML, for example.
また、本発明による請求項構造情報生成装置では、生成部は、あらかじめ規定されているトークンの付与された記述断片及び区切文節タイプの付与された記述断片の係り受け関係に応じて、トークン付与部が付与したトークン及び区切文節タイプ付与部が付与した区切文節タイプで区切の示される記述断片間の係り受け関係を特定し、記述断片間の係り受け関係を示す請求項構造情報を生成してもよい。
このような構成により、トークンや区切文節タイプによって区切位置が示される記述断片の間の係り受け関係を示す請求項構造情報を得ることができる。
Further, in the claim structure information generating apparatus according to the present invention, the generating unit includes a token granting unit according to a dependency relationship between a description fragment to which a predetermined token is assigned and a description fragment to which a delimiter clause type is assigned. Even if the dependency relationship between the description fragments indicated by the delimiter is specified by the token given by the delimiter and the delimiter clause type given by the delimiter clause type assignment unit, the claim structure information indicating the dependency relationship between the description fragments may be generated. Good.
With such a configuration, it is possible to obtain claim structure information indicating a dependency relationship between description fragments whose delimiter positions are indicated by tokens or delimiter clause types.
また、本発明による請求項構造情報生成装置では、出力部は、生成部が生成した請求項構造情報を、記述断片間の関係が分かるように表示してもよい。
このような構成により、その表示された請求項構造情報を見ることによって、特許の専門家でなくても、特許請求項の構造を容易に把握することができるようになる。
In the claim structure information generating apparatus according to the present invention, the output unit may display the claim structure information generated by the generation unit so that the relationship between the description fragments can be understood.
With such a configuration, by viewing the displayed claim structure information, it is possible to easily grasp the structure of a claim even if it is not a patent expert.
また、本発明による請求項構造情報生成装置では、トークンには、構成要素の包含関係に応じたトークンが存在し、区切文節タイプには、構成要素の包含関係を示すトークンに対して、親の構成要素に応じた区切文節タイプである親区切文節タイプと、構成要素の包含関係を示すトークンに対して、子の構成要素に応じた区切文節タイプである子区切文節タイプと、が存在し、出力部は、親区切文節タイプに対応する記述断片と、子区切文節タイプに対応する記述断片との親子関係が分かるように両記述断片を表示してもよい。
このような構成により、特許請求項に含まれる構成要素の親子関係をより明確に示すことができるようになる。
In the claim structure information generating device according to the present invention, the token includes a token corresponding to the inclusion relation of the component, and the delimiter clause type includes a parent of the token indicating the inclusion relation of the component. There are a parent delimiter clause type that is a delimiter clause type according to the component, and a child delimiter clause type that is a delimiter clause type according to the child component for the token indicating the inclusion relationship of the component, The output unit may display both description fragments so that the parent-child relationship between the description fragment corresponding to the parent-delimited clause type and the description fragment corresponding to the child-delimited clause type can be understood.
With such a configuration, the parent-child relationship of the constituent elements included in the claims can be shown more clearly.
また、本発明による請求項構造情報生成装置では、親区切文節タイプと子区切文節タイプとの付与された特許請求項情報を用いて、構成要素の親子関係を取得する親子関係取得部と、親子関係取得部が取得した構成要素の親子関係を用いて、構成要素の階層レベルを取得する階層レベル取得部と、を備え、出力部は、階層レベル取得部が取得した階層レベルに応じて、親区切文節タイプ及び子区切文節タイプに対応する記述断片を表示してもよい。
このような構成により、階層レベルに応じた表示が可能となり、例えば、ある構成要素がどの階層に存在するのかを容易に把握することができるようになる。
Further, in the claim structure information generating device according to the present invention, a parent-child relationship acquisition unit for acquiring a parent-child relationship of the constituent elements using the claim information to which a parent-delimited clause type and a child-delimited clause type are attached, and a parent-child A hierarchy level acquisition unit that acquires the hierarchy level of the component using the parent-child relationship of the component acquired by the relationship acquisition unit, and the output unit includes a parent according to the hierarchy level acquired by the hierarchy level acquisition unit. A description fragment corresponding to the delimiter clause type and the child delimiter clause type may be displayed.
With such a configuration, it is possible to display according to the hierarchy level, and for example, it is possible to easily grasp in which hierarchy a certain component exists.
本発明による請求項構造情報生成装置等によれば、より深い構造を持つ特許請求項についても、構造解析を行うことができる。 According to the claim structure information generating apparatus and the like according to the present invention, it is possible to perform structural analysis even for a claim having a deeper structure.
以下、本発明による請求項構造情報生成装置について、実施の形態を用いて説明する。なお、以下の実施の形態において、同じ符号を付した構成要素及びステップは同一または相当するものであり、再度の説明を省略することがある。 Hereinafter, a claim structure information generation device according to the present invention will be described using embodiments. In the following embodiments, components and steps denoted by the same reference numerals are the same or equivalent, and repetitive description may be omitted.
(実施の形態1)
本発明の実施の形態1による請求項構造情報生成装置について、図面を参照しながら説明する。本実施の形態による請求項構造情報生成装置は、表層及び品詞の手がかり情報を用いることによって、より深い構造を持つ特許請求項についても、構造解析を行うものである。
(Embodiment 1)
A claim structure information generation device according to
図1は、本実施の形態による請求項構造情報生成装置1の構成を示すブロック図である。本実施の形態による請求項構造情報生成装置1は、特許請求項のテキストが区切られた記述断片とその記述断片の構造とを示す請求項構造情報を生成するものであって、記憶部11と、形態素解析部12と、文節特定部13と、表層区切情報記憶部14と、トークン付与部15と、文節タイプ対応情報記憶部16と、区切文節タイプ付与部17と、区切文節タイプ変更部18と、生成部19と、出力部20とを備える。なお、記述断片とは、特許請求項において、係り受け関係を解析する単位であり、隣接する複数の文字から構成されるものである。記述断片は、例えば、構成要素を含む文節であってもよく、構成要素に関する説明であってもよく、特許請求項に独特な表現(例えば、構成要素の包含関係を示す表現や、ジェプソン形式であることを示す表現、引用関係を示す表現等)であってもよく、その他のものであってもよい。
FIG. 1 is a block diagram showing a configuration of a claim structure
記憶部11では、特許請求項のテキストである特許請求項情報が記憶される。その特許請求項情報は、例えば、一の請求項の情報であってもよく、あるいは、複数の請求項の情報であってもよい。後者の場合には、複数の請求項は、従属関係を有するものであってもよく、あるいは、そうでなくてもよい。また、その特許請求項情報は、例えば、特許公報や特許公開公報における[特許請求の範囲]の情報であってもよく、あるいは、そうでなくてもよい。この記憶部11で記憶される特許請求項情報が、構造解析の対象となるものである。
The
記憶部11に特許請求項情報が記憶される過程は問わない。例えば、記録媒体を介して情報が記憶部11で記憶されるようになってもよく、通信回線等を介して送信された特許請求項情報が記憶部11で記憶されるようになってもよく、あるいは、入力デバイスを介して入力された特許請求項情報が記憶部11で記憶されるようになってもよい。記憶部11での記憶は、RAM等における一時的な記憶でもよく、あるいは、長期的な記憶でもよい。記憶部11は、所定の記録媒体(例えば、半導体メモリや磁気ディスク、光ディスクなど)によって実現されうる。なお、記憶部11において、特許請求項情報以外の情報が記憶されてもよいことは言うまでもない。例えば、後述する各構成要素による処理の結果の情報(具体的には、形態素解析の結果や、付与されたトークン、文節タイプ等)が記憶部11で記憶されてもよい。
The process in which the claim information is stored in the
形態素解析部12は、記憶部11で記憶されている特許請求項情報を形態素解析する。その形態素解析によって、特許請求項情報のテキストを形態素に分けることができ、また形態素ごとの品詞の情報を得ることができる。その形態素解析のシステムとしては、例えば、京都大学情報学研究科−日本電信電話株式会社コミュニケーション科学基礎研究所共同研究ユニットプロジェクトを通じて開発された「MeCab」や、奈良先端科学技術大学院大学で開発された「ChaSen(茶筌)」(http://chasen.naist.jp)等が知られている。例えば、「MeCab」の場合には、出力フォーマットのパラメータを指定することで、各形態素を1行で表示し、かつ、「見出し」、「品詞文字列」、「活用形」、「見出し(基本形)」、「2階層目の品詞」の5つの情報をタブ区切りで出力させることができる。なお、「MeCab」は1行ごとに解析を行う仕様となっているため、特許請求項情報のテキストにおいて改行が存在する場合には、行ごとに形態素解析を行い、行の区切りを示す品詞文字列(例えば、「NEWLINE」等)を挿入した上で、結果を連結させてもよい。この形態素解析部12による形態素解析の結果は、記憶部11で記憶されてもよく、あるいは、他の図示しない記録媒体で記憶されてもよい。
The
文節特定部13は、特許請求項情報の文節の区切位置を特定する。この文節の区切位置を特定する方法は問わない。例えば、形態素解析の結果である形態素を文節単位にまとめ上げることによって、文節の区切位置を特定してもよく、あるいは、手がかり句やその他の情報を用いることによって、特許請求項情報そのものから文節の区切位置を特定してもよい。本実施の形態では、前者の場合について説明する。その前者の場合には、文節特定部13は、例えば、図5で示される状態遷移表と、形態素解析の結果である「品詞文字列」、「活用形」、「2階層目の品詞」とを用いて、形態素を文節にまとめ上げてもよい。例えば、形態素A,Bがこの順番で並んでいた場合に、図5の状態遷移表における形態素Aに対応する「現在」の行と、形態素Bに対応する「次」の列との交わるところの数値が「1」であれば、形態素A,Bの間に文節の区切位置が存在しないことになり(すなわち、形態素A,Bは同じ文節に含まれることになる)、その数値が「0」であれば、形態素A,Bの間に文節の区切位置が存在することになる(すなわち、形態素A,Bは異なる文節に含まれることになる)。この処理をすべての隣接する2個の形態素について行うことによって、文節特定部13は、文節の区切位置を特定することができる。なお、これ以外の方法によって、文節の区切位置の特定を行ってもよいことは言うまでもない。例えば、連続する2個の形態素について、両者が同一の文節に含まれるべきかどうかを記述するルールを列挙し、それを順次適用することで文節まとめ上げをしてもよい。また、文節の区切位置を特定するとは、例えば、文節の区切位置を示す情報(例えば、文節の区切位置に応じた先頭からの文字数や、バイト数等)を記憶部11や図示しない記録媒体に蓄積することであってもよく、形態素間の文節の区切位置に対応する箇所に、区切位置であることを示す情報を挿入することであってもよく、形態素解析の結果である各形態素を、文節単位にまとめ上げることであってもよく、あるいは、文節の区切位置を知ることができるその他の方法であってもよい。また、文節特定部13が文節の区切位置の特定を行うタイミングは、その特定を形態素解析の結果を用いて行う場合には、形態素解析部12による形態素解析の後となる。また、その特定を、後述する表層の手がかり情報に対応するトークンをも用いて行う場合には、文節特定部13は、後述するトークン付与部15によるトークンの付与後に文節の区切位置の特定を行ってもよい。また、その特定を、特許請求項情報そのものから行う場合には、文節特定部13は、形態素解析やトークンの付与と関係のないタイミングで文節の区切位置の特定を行ってもよい。
The
表層区切情報記憶部14では、2以上の表層区切情報が記憶される。ここで、表層区切情報は、記述断片の区切となると共に記述断片間の関係を示す表層の手がかり情報と、その表層の手がかり情報に対応するトークンとを有する情報である。表層とは、文字列そのものの意味である。前述のMeCabの説明における「見出し」が表層である。表層の手がかり情報は、いわゆる手がかり句のことである。その表層の手がかり情報は、通常、正規表現を用いて記述される。トークンは、その表層の手がかり情報を識別する情報である。
The surface layer delimiter
その表層の手がかり情報には、例えば、ジェプソン形式の記載(例えば、「において、」等)に応じたものが存在してもよく、特徴記載(例えば、「を特徴とする、」等)に応じたものが存在してもよく、構成要素の包含関係の記載(例えば、「を備えた」「を備えており、」等)に応じたものが存在してもよく、引用関係の記載(例えば、「請求項…に」等)に応じたものが存在してもよい。また、それらの表層の手がかり情報に対応して、ジェプソン形式のトークンや、特徴記載のトークン、構成要素の包含関係のトークン、引用関係のトークン等が存在してもよい。この表層の手がかり情報は、記述断片の区切となるものである。すなわち、表層の手がかり情報に該当する位置の直前及び/または直後が、通常、記述断片の区切位置となる。また、表層の手がかり情報によって、記述断片の間の関係が検出されることになる。すなわち、表層の手がかり情報は、その表層の手がかり情報を用いることによって記述断片間の関係を検出できる、という意味において、記述断片間の関係を示すものである。その記述断片間の関係は、例えば、記述断片の係り受けの関係であり、その係り受けの詳細については後述する。 The surface layer clue information may include, for example, information according to a Jepson format description (for example, “in”), or according to a characteristic description (for example, “characterizes”, etc.). May be present, or may be in accordance with the description of the inclusion relationship (for example, “has”, “has,” etc.) of the constituent elements, and the description of the citation relationship (for example, , “According to“ claim ”, etc.)) may exist. Corresponding to the surface layer clue information, there may be a Jepson token, a feature description token, a component inclusion token, a citation token, or the like. This clue information on the surface layer serves as a delimiter for description fragments. That is, the position immediately before and / or immediately after the position corresponding to the clue information on the surface layer is usually the delimiter position of the description fragment. Further, the relationship between the description fragments is detected based on the clue information on the surface layer. That is, the clue information on the surface layer indicates the relationship between the description fragments in the sense that the relationship between the description fragments can be detected by using the clue information on the surface layer. The relationship between the description fragments is, for example, a dependency relationship of description fragments, and details of the dependency will be described later.
表層区切情報記憶部14に2以上の表層区切情報が記憶される過程は問わない。例えば、記録媒体を介して2以上の表層区切情報が表層区切情報記憶部14で記憶されるようになってもよく、通信回線等を介して送信された2以上の表層区切情報が表層区切情報記憶部14で記憶されるようになってもよく、あるいは、入力デバイスを介して入力された2以上の表層区切情報が表層区切情報記憶部14で記憶されるようになってもよい。表層区切情報記憶部14での記憶は、RAM等における一時的な記憶でもよく、あるいは、長期的な記憶でもよい。表層区切情報記憶部14は、所定の記録媒体(例えば、半導体メモリや磁気ディスク、光ディスクなど)によって実現されうる。
The process in which two or more surface layer division | segmentation information is memorize | stored in the surface layer division | segmentation
また、表層区切情報に含まれる各情報、例えば、表層の手がかり情報やトークンは、それらの情報そのものであってもよく、あるいは、それらの情報を特定可能な情報であってもよい。後者の場合には、表層区切情報に含まれる表層の手がかり情報等は、例えば、表層の手がかり情報等が格納されている領域を示すポインタやアドレスであってもよい。このことは、他の情報についても同様であるとする。 In addition, each information included in the surface layer delimiter information, for example, surface layer clue information and tokens, may be the information itself, or may be information that can identify the information. In the latter case, the surface layer clue information and the like included in the surface layer separation information may be, for example, a pointer or an address indicating an area in which the surface layer clue information or the like is stored. This is the same for other information.
トークン付与部15は、特許請求項情報において、表層の手かがり情報に該当する位置に、その表層の手がかり情報に対応するトークンを付与する。トークンを付与するとは、特許請求項情報において、結果としてトークンに対応する位置を特定することができるのであれば、その手法は問わない。トークン付与部15は、例えば、特許請求項情報の文字列そのものに対して、トークンを追記してもよく、あるいは、トークンと、そのトークンに対応する特許請求項情報の範囲とを対応付ける情報を記憶部11や他の図示しない記録媒体に蓄積してもよい。本実施の形態では、前者の場合について説明する。トークン付与部15は、例えば、表層区切情報に含まれる表層の手がかり情報を検索キーとして特許請求項情報を検索し、ヒットした箇所に、その表層の手がかり情報に対応するトークンを付与してもよい。トークン付与部15は、そのような処理を、表層区切情報に含まれるすべての表層の手がかり情報について行ってもよい。なお、第1の表層の手がかり情報(例えば、「ことを特徴とする」)が、第2の表層の手がかり情報(例えば、「を特徴とする」)を含む場合には、トークン付与部15は、例えば、第1の表層の手がかり情報から先に検索を行ってトークンを付与し、トークンの付与されている箇所は、それ以降の検索時に検索を行わないようにしてもよい。または、トークン付与部15は、例えば、第2の表層の手がかり情報から先に検索を行ってトークンを付与し、第1の表層の手がかり情報を用いた検索を行う際に、すでにトークンの付与されている箇所についても検索を行って、すでにトークンの付与されている箇所がヒットした際には、上書きでトークンを付与してもよい。
In the claim information, the
文節タイプ対応情報記憶部16では、2以上の文節タイプ対応情報が記憶される。ここで、文節タイプ対応情報は、記述断片の区切となる文節の品詞の手がかり情報と、その品詞の手がかり情報に対応する区切文節タイプとを有する情報である。品詞の手がかり情報は、表層の手がかり句の品詞版と言いうるものである。すなわち、品詞の手がかり情報は、品詞に関する条件を少なくとも含む手がかり情報である。品詞の手がかり情報は、品詞のみを特定する情報であってもよく、品詞と活用形とを特定する情報であってもよく、品詞や、品詞と活用形以外に、表層の情報をも特定する情報であってもよく、その他の品詞に関係する情報であってもよい。なお、品詞の手がかり情報には、記述断片の区切とは関係のない文節の品詞の手がかり情報が存在してもよい。その場合には、そのような区切と関係のない文節の品詞の手がかり情報に対応する文節のタイプと、区切文節タイプとを含めて、単に文節タイプと呼ぶことにする。すなわち、文節タイプには、その文節が記述断片の区切となる区切文節タイプと、区切とは関係のないものとが存在することになる。
The phrase type correspondence
その品詞の手がかり情報には、例えば、並列する記述断片の終端の区切文節タイプ(以下、これを「終端区切文節タイプ」と呼ぶこともある)に応じたもの(例えば、「動詞や助動詞の終止形」等)が存在してもよく、並列する記述断片が継続しうる(すなわち、終端とは言えない)区切文節タイプ(以下、これを「継続区切文節タイプ」と呼ぶこともある)に応じたもの(例えば、「動詞や助動詞の連用形」「名詞+と」等)が存在してもよい。また、その他の品詞の手かがり情報が存在してもよい。 The part-of-speech clue information includes, for example, information corresponding to the delimiter clause type at the end of parallel description fragments (hereinafter also referred to as “terminal delimiter clause type”) (for example, “end of verb or auxiliary verb”) Depending on the delimiter clause type (hereinafter sometimes referred to as the “continue delimiter clause type”) in which parallel description fragments can continue (that is, cannot be said to be terminal). May be present (for example, “verb or auxiliary verb continuous form”, “noun + and”, etc.). Further, other part-of-speech cue information may exist.
文節タイプ対応情報記憶部16に2以上の文節タイプ対応情報が記憶される過程は問わない。例えば、記録媒体を介して2以上の文節タイプ対応情報が文節タイプ対応情報記憶部16で記憶されるようになってもよく、通信回線等を介して送信された2以上の文節タイプ対応情報が文節タイプ対応情報記憶部16で記憶されるようになってもよく、あるいは、入力デバイスを介して入力された2以上の文節タイプ対応情報が文節タイプ対応情報記憶部16で記憶されるようになってもよい。文節タイプ対応情報記憶部16での記憶は、RAM等における一時的な記憶でもよく、あるいは、長期的な記憶でもよい。文節タイプ対応情報記憶部16は、所定の記録媒体(例えば、半導体メモリや磁気ディスク、光ディスクなど)によって実現されうる。
The process in which two or more phrase type correspondence information is stored in the phrase type correspondence
区切文節タイプ付与部17は、特許請求項情報において、品詞の手がかり情報に該当する文節に、品詞の手がかり情報に対応する区切文節タイプを付与する。区切文節タイプ付与部17は、区切文節タイプではない文節タイプを付与してもよい。また、区切文節タイプ付与部17は、形態素解析部12による形態素解析の結果を用いて、この付与の処理を行うものとする。文節タイプの付与は、前述したトークンの付与と同様に、特許請求項情報において、結果として文節タイプに対応する位置を特定することができるのであれば、その手法は問わない。例えば、特許請求項情報の文字列そのものに対して、文節タイプを追記してもよく、あるいは、文節タイプと、その文節タイプに対応する特許請求項情報の範囲とを対応付ける情報を記憶部11や他の図示しない記録媒体に蓄積してもよい。本実施の形態では、前者の場合について説明する。区切文節タイプ付与部17は、例えば、文節タイプ対応情報に含まれる品詞の手がかり情報を検索キーとして形態素解析の結果を検索し、ヒットした箇所に、その品詞の手がかり情報に対応する文節タイプを付与してもよい。区切文節タイプ付与部17は、そのような処理を、文節タイプ対応情報に含まれるすべての品詞の手がかり情報について行ってもよい。なお、第1の品詞の手がかり情報が、第2の品詞の手がかり情報を含む場合には、トークンの付与の場合と同様に、例えば、第1の品詞の手がかり情報から先に文節タイプの付与を行い、すでに文節タイプの付与されている箇所は、それ以降の文節タイプの付与を行わないようにしてもよく、または、第2の品詞の手がかり情報から先に文節タイプの付与を行い、第1の品詞の手がかり情報を用いた文節タイプの付与を行う際に、すでに文節タイプの付与されている箇所については、上書きで文節タイプを付与してもよい。この区切文節タイプ付与部17による文節タイプの付与の結果、一の文節に一の文節タイプが付与されることになる。なお、文節タイプの付与されない文節が存在してもよい。また、今後の説明において、文節タイプAの付与された文節のことを、単にAと呼ぶこともある。
The demarcation phrase
区切文節タイプ変更部18は、記述断片の区切の並びに応じて、記述断片の区切でない位置に存在する区切文節タイプを削除する。「記述断片の区切の並びに応じて」とは、特許請求項情報に付与されたトークンや区切文節タイプの並びに応じて、ということである。すなわち、付与されたトークンや区切文節タイプの並びが所定の条件を満たした場合に、区切文節タイプ変更部18は、その条件を満たした並びにおける特定の区切文節タイプを削除する。具体的には、区切文節タイプ変更部18は、終端区切文節タイプと、その終端区切文節タイプより以前の(すなわち、それよりも先頭に近い位置に存在する)継続区切文節タイプとの間に終端区切文節タイプが存在する場合に、その終端区切文節タイプと継続区切文節タイプとの間に存在する終端区切文節タイプを削除してもよい。また、区切文節タイプ変更部18は、改行が存在する場合であって、改行が後続しない、動詞に関する区切文節タイプ(この区切文節タイプは、例えば、動詞に関する終端区切文節タイプであってもよく、動詞に関する継続区切文節タイプであってもよい)が存在する場合に、その区切文節タイプを削除してもよい。なお、「改行が後続しない」区切文節タイプとは、その区切文節タイプの付与された文節の直後に改行が存在しない区切文節タイプのことである。また、「動詞に関する区切文節タイプ」とは、動詞または助動詞に関する品詞の手がかり情報に対応する区切文節タイプのことである。また、区切文節タイプ変更部18は、注目している範囲内において、その処理を行ってもよい。例えば、区切文節タイプ変更部18は、ジェプソン形式のトークンの付与されている位置よりも先頭に近い部分(この部分を「前半部」と呼ぶこともある)について、この処理を行い、また、ジェプソン形式のトークンの付与されている位置よりも終端に近い部分(この部分を「後半部」と呼ぶこともある)について、この処理を行ってもよい。また、例えば、区切文節タイプ変更部18は、一つの請求項の全体に対してこの処理を行ってもよい。また、区切文節タイプ変更部18は、区切文節タイプの削除以外に、文節タイプの付け替え(変更)を行ってもよい。区切文節タイプ変更部18は、区切文節タイプではない文節タイプを、区切文節タイプに変更してもよく、あるいは、区切文節タイプを区切文節タイプではない文節タイプに変更してもよい。後者は、区切文節タイプがなくなるという意味において、区切文節タイプの削除であると言うこともできる。
The delimiter clause
また、区切文節タイプ変更部18は、トークンや文節タイプの並びに応じて、区切文節タイプではない文節タイプを区切文節タイプに変更してもよい。この場合には、新たな区切文節タイプが生成されることになる。例えば、区切文節タイプ変更部18は、改行が存在する場合であって、改行が後続する、動詞に関する文節タイプ(この文節タイプは区切文節タイプではないものとする)が存在する場合に、その文節タイプを区切文節タイプに変更してもよい。また、例えば、区切文節タイプ変更部18は、構成要素の包含関係のトークンの直前の名詞に関する文節タイプ(この文節タイプは区切文節タイプではないものとする)が存在する場合に、その文節タイプを区切文節タイプに変更してもよい。名詞に関する文節タイプとは、名詞に関する品詞の手がかり情報に対応する文節タイプのことである。また、区切文節タイプ変更部18による文節タイプの変更には、後述する生成部19において、構文解析器を用いた解析が行われる場合に、その解析に合致する記述とするための変更が含まれてもよい。
Further, the delimiter clause
ここで、トークンの付与と、文節タイプの付与、及び文節タイプの変更について簡単に説明する。特許請求項情報にトークンや文節タイプが付与されることによって、特許請求項情報における記述断片の区切位置を特定することができるようになる。トークンは、表層の手がかり句を用いて付与されるものであり、文節タイプは、品詞に関する条件を用いて付与されるものである。また、文節タイプが変更されることによって、その区切位置がより適切なものとなることになる。なお、本実施の形態による請求項構造情報生成装置1では、文節を単位として記述断片の区切位置を検出するため、従来例のように形態素を単位として記述断片の区切位置の検出を行う場合よりも、より詳細な構造に関するルールを設定することができる。従来例の場合には、文節よりも細かい形態素を単位としていたため、より詳細な構造に関するルールを設定しようとした場合に、そのルールが非常に細かいものとなってしまい、実質的にルールを作り上げることができなかった。一方、本実施の形態による請求項構造情報生成装置1では、文節を単位としているため、より詳細な構造に関するルールを妥当な範囲で設定することができ、より詳細な構造に関する解析が可能となった。
Here, a brief description will be given of token assignment, clause type assignment, and clause type change. By adding a token or clause type to the claim information, it becomes possible to specify the delimiter position of the description fragment in the claim information. The token is given using a cue phrase on the surface layer, and the phrase type is given using a condition related to the part of speech. In addition, when the phrase type is changed, the delimiter position becomes more appropriate. Since the claim structure
生成部19は、特許請求項情報に付与されたトークンと区切文節タイプとを用い、あらかじめ規定されている特許請求項の構造を示す規則に応じて、特許請求項情報の記述断片の構造を示す請求項構造情報を生成する。なお、区切文節タイプ変更部18による区切文節タイプの削除や文節タイプの変更が行われた場合には、生成部19は、区切文節タイプ変更部18が区切文節タイプを削除したり、文節タイプを変更したりした後に、請求項構造情報を生成する。すなわち、その削除や変更の行われた後の、特許請求項情報に付与されたトークンと区切文節タイプとを用いて、生成部19は、請求項構造情報を生成する。請求項構造情報は、記述断片の区切と、その記述断片の属性とを少なくとも示す情報である。記述断片の属性とは、例えば、記述断片が構成要素名を含むことを示すものであってもよく、記述断片が、構成要素名を含む記述断片に対する説明であることを示すものであってもよく、記述断片がジェプソン形式の記載であることを示すものであってもよく、記述断片が構成要素の包含関係の記載であることを示すものであってもよく、記述断片間の係り受け関係を示すものであってもよい。生成部19は、特許請求項情報に付与されたトークンや区切文節タイプの種類に応じて、記述断片の区切位置を特定することができる。例えば、トークンや区切文節タイプと、そのトークンや区切文節タイプに対応する区切位置とを有する情報を用いて、生成部19は、記述断片の区切位置を特定できる。また、生成部19は、特許請求項情報に付与されたトークンや区切文節タイプそのもの、あるいは、それらの並びに応じて、記述断片の属性を特定することができる。例えば、トークンや区切文節タイプと、そのトークンや区切文節タイプに対応する属性とを有する情報を用いて、生成部19は、記述断片の属性を特定できる。また、例えば、トークンや区切文節タイプの並びを示す情報と、そのトークンや区切文節タイプに対応する属性とを有する情報を用いて、生成部19は、記述断片の属性を特定できる。
The
生成部19は、例えば、構文解析器を用いて、トークン及び区切文節タイプの付与された特許請求項情報に対応する請求項構造情報を生成してもよい。その構文解析器(パーサ)は、文脈自由文法で記述されたトークン及び区切文節タイプに関する規則と、規則に対応する構造を特許請求項情報に付与するアクションとを有する文法ファイルを用いて生成されたものである。すなわち、その構文解析器によって、トークン及び区切文節タイプの付与された特許請求項情報を解析することによって、請求項構造情報が得られる。この場合には、生成部19は、あらかじめ規定されている特許請求項の構造を示す規則である文法ファイルに応じて、請求項構造情報を生成することになる。生成部19は、その特許請求項情報に、文法ファイルに含まれる規則に対応した構造を示すマーク(例えば、タグなど)を付与することによって、マークアップ言語を用いて記述された請求項構造情報を生成してもよい。その規則は、例えば、トークンや区切文節タイプの並びに関する規則であってもよい。また、アクションは、記述断片の属性に応じたものであってもよい。マークアップ言語は、例えば、XML(Extensible Markup Language)であってもよく、その他のものであってもよい。そのXMLの構造としては、谷川英和らが提案しているPML(Patent Markup Language)を使用してもよい(http://www.ird−pat.com/pml.html)。また、その構文解析器を用いて請求項構造情報を生成する際に、生成部19は、トークン及び区切文節タイプの付与された特許請求項情報を終端から先頭への方向で取り込むことによって請求項構造情報を生成してもよい。特許請求項では、終端に定型的な表現が存在し、その終端から先頭の方向で構造が確定するため、このような構成により、文法のあいまいさに起因する問題の発生を回避することができうる。例えば、shift/reduce conflictや、reduce/reduce conflictといった曖昧性を回避することができる。なお、この場合には、特許請求項の構造の文脈自由文法による記述が特許請求項の終端から先頭への方向で記述されているものとする。
The
また、生成部19は、例えば、あらかじめ規定されているトークンの付与された記述断片及び区切文節タイプの付与された記述断片の係り受け関係に応じて、トークン付与部15が付与したトークン及び区切文節タイプ付与部17が付与した区切文節タイプで区切の示される記述断片間の係り受け関係を特定し、記述断片間の係り受け関係を示す請求項構造情報を生成してもよい。この場合には、あらかじめ規定されているトークンの付与された記述断片及び区切文節タイプの付与された記述断片の係り受け関係が、あらかじめ規定されている特許請求項の構造を示す規則である。あらかじめ規定されているトークンの付与された記述断片及び区切文節タイプの付与された記述断片の係り受け関係には、例えば、トークンの付与された記述断片同士の係り受け関係が含まれてもよく、区切文節タイプの付与された記述断片同士の係り受け関係が含まれてもよく、トークンの付与された記述断片と区切文節タイプの付与された記述断片との間の係り受け関係が含まれてもよい。例えば、区切文節タイプAの付与された記述断片は、トークンBの付与された記述断片に係ることがあらかじめ規定されている場合には、生成部19は、区切文節タイプAの付与された記述断片が、トークンBの付与された記述断片に係る、という係り受け関係を示す請求項構造情報を生成してもよい。その請求項構造情報は、例えば、記述断片と、その記述断片が係る記述断片を識別する情報とを対応付けた情報であってもよい。
In addition, the
出力部20は、生成部19が生成した請求項構造情報を出力する。ここで、この出力は、例えば、表示デバイス(例えば、CRTや液晶ディスプレイなど)への表示でもよく、所定の機器への通信回線を介した送信でもよく、プリンタによる印刷でもよく、記録媒体への蓄積でもよく、他の構成要素への引き渡しでもよい。その出力が表示である場合に、出力部20は、生成部19が生成した請求項構造情報を、記述断片間の関係が分かるように表示してもよい。例えば、請求項構造情報が、記述断片間の係り受け関係を示すものである場合には、出力部20は、記述断片と、その記述断片間の係り受けに対応する図形とを表示してもよい。その係り受けに対応する図形は、例えば、係り受け関係のある2個の記述断片をつなぐ線の図形であってもよく、係り受け関係のある2個の記述断片の双方に付与された同じマークの図形であってもよく、その他の係り受け関係を示す図形であってもよい。また、例えば、請求項構造情報が、記述断片の区切と、その記述断片の属性とを少なくとも示す情報である場合には、出力部20は、あらかじめ規定されている属性の係り受け関係に応じて、記述断片間の係り受け関係が分かるように表示してもよい。その表示は、例えば、前述のように、記述断片と、その記述断片間の係り受けに対応する図形とを表示するものであってもよい。
The
なお、出力部20は、出力を行うデバイス(例えば、表示デバイスやプリンタなど)を含んでもよく、あるいは含まなくてもよい。また、出力部20は、ハードウェアによって実現されてもよく、あるいは、それらのデバイスを駆動するドライバ等のソフトウェアによって実現されてもよい。
The
なお、記憶部11と、表層区切情報記憶部14と、文節タイプ対応情報記憶部16との任意の2以上の記憶部は、同一の記録媒体によって実現されてもよく、あるいは、別々の記録媒体で実現されてもよい。前者の場合には、例えば、特許請求項情報を記憶している領域が記憶部11となり、表層区切情報を記憶している領域が表層区切情報記憶部14となる。
Note that any two or more storage units of the
次に、本実施の形態による請求項構造情報生成装置1の動作について、図2のフローチャートを用いて説明する。なお、このフローチャートにおいて、形態素解析やトークンの付与等の行われた特許請求項情報が、すべて記憶部11で記憶される場合について説明する。
Next, operation | movement of the claim structure
(ステップS101)形態素解析部12は、記憶部11で記憶されている特許請求項情報を形態素解析する。そして、形態素解析部12は、その結果を記憶部11に蓄積する。その形態素解析の結果は、例えば、一つの形態素の情報が一行となるテキストファイルであってもよい。
(Step S <b> 101) The
(ステップS102)トークン付与部15は、記憶部11で記憶されている特許請求項情報に対して、表層区切情報記憶部14で記憶されている表層区切情報を用いて、トークンの付与を行う。付与されたトークンは、記憶部11において、特許請求項情報の該当箇所に対応付けられて記憶されるものとする。トークンは、例えば、形態素解析の結果のテキストファイルにおいて、表層の手がかり情報に該当する箇所と同じ行に追記されてもよい。なお、表層の手がかり情報に該当する箇所が複数の形態素にまたがる場合には、トークン付与部15は、例えば、その複数の形態素を一つにまとめてもよい。
(Step S <b> 102) The
(ステップS103)文節特定部13は、記憶部11で記憶されている形態素解析後の各形態素をまとめ上げることによって、文節の区切を特定する。文節特定部13は、例えば、特定した文節の区切位置である形態素の間に、文節の区切位置であることを示す情報を追記してもよい。
(Step S <b> 103) The
(ステップS104)区切文節タイプ付与部17は、記憶部11で記憶されている特許請求項情報の文節に対して、文節タイプ対応情報記憶部16で記憶されている文節タイプ対応情報を用いて、文節タイプを付与する。その付与する文節タイプには、区切文節タイプが含まれていることは前述の通りである。付与された文節タイプは、記憶部11において、特許請求項情報の該当する文節に対応付けられて記憶されるものとする。文節タイプは、例えば、文節の区切位置の特定後のテキストファイルにおいて、品詞の手がかり情報に該当する箇所と同じ行に追記されてもよい。なお、一つの文節が複数の形態素から構成されている場合には、区切文節タイプ付与部17は、例えば、この文節タイプの付与後に、文節ごとに一行となるように、その複数の形態素をまとめてもよい。
(Step S104) The demarcation phrase
(ステップS105)区切文節タイプ変更部18は、付与された文節タイプを、トークンや文節タイプの並びに応じて変更する。その変更には、記述断片の区切でない位置に存在する区切文節タイプを削除することが含まれることは、前述の通りである。また、区切文節タイプ変更部18は、前述のように、区切文節タイプでない文節タイプを区切文節タイプに変更してもよく、その他の文節タイプの変更を行ってもよい。
(Step S105) The delimited phrase
(ステップS106)生成部19は、トークンや文節タイプの付与された特許請求項情報から、請求項構造情報を生成する。
(Step S106) The
(ステップS107)出力部20は、生成部19が生成した請求項構造情報を出力する。そして、請求項構造情報を生成し、出力する一連の処理が終了となる。
(Step S107) The
なお、特許請求項情報に複数の請求項が含まれる場合には、図2のフローチャートにおいて、ステップS101〜S107の処理を、請求項ごとに繰り返して実行してもよく、あるいは、複数の請求項の全体に対して、ステップS101〜S107の処理を行ってもよい。また、文節の区切位置の特定において付与されたトークンを用いない場合には、トークンの付与の処理を行うタイミングは、文節タイプの変更の処理(ステップS105)よりも以前であればいつでもよい。 In addition, when a plurality of claims are included in the claim information, the processing of steps S101 to S107 may be repeatedly executed for each claim in the flowchart of FIG. 2, or a plurality of claims. You may perform the process of step S101-S107 with respect to the whole. In addition, when the token given in specifying the segment break position is not used, the token granting process may be performed at any time before the phrase type change process (step S105).
次に、本実施の形態による請求項構造情報生成装置1の動作について、具体例を用いて説明する。この具体例では、一の請求項に関する処理について説明するが、特許請求項情報に複数の請求項が含まれていた場合には、その処理を繰り返して実行することによって、複数の請求項についても、解析を行うことができる。また、ここでも、従来例の説明と同様に、次の特許請求項情報が記憶部11で記憶されているものとする。
Next, operation | movement of the claim structure
[特許請求項情報]
画像形成装置において、
外部に接続されるダクトと、
エアを排出する送風手段と、
エアを清浄化する清浄化手段と、を備え、
前記ダクトは内部ダクトを有し、
前記清浄化手段は、前記内部ダクト内に設置されている、
ことを特徴とする画像形成装置。
[Claim Information]
In the image forming apparatus,
A duct connected to the outside;
Air blowing means for discharging air;
A cleaning means for cleaning air,
The duct has an internal duct;
The cleaning means is installed in the internal duct,
An image forming apparatus.
また、この具体例において、表層区切情報記憶部14では、図3で示される6種類の表層区切情報が記憶されているものとする。なお、図3における表層の手がかり情報の表現、及びこれ以降の説明において、Perl言語の正規表現の表記を用いている。なお、そのPerl言語については、次の文献を参照されたい。
文献:Larry Wall,Tom Christiansen,Randal L.Shcwartz、「プログラミングPerl 改訂版」、オライリージャパン、1997年
Further, in this specific example, it is assumed that the surface layer delimiter
Literature: Larry Wall, Tom Christiansen, Randal L. Shwartz, "Programming Perl Revised Edition", O'Reilly Japan, 1997
図3の表層区切情報の表層の手がかり情報において、複数行で記述している手がかり情報は、いずれか一つに該当した場合に、対応するトークンを付与することを意味している。トークン「JEPSON_CUE」は、ジェプソン形式の特許請求項に特徴的な手がかり句に対応するものである。トークン「FEATURE_CUE」、「FEATURE_K_CUE」は、特許請求項で使用される特徴記載の手がかり句に対応するものである。トークン「COMPOSE_K_CUE」は、「〜と、〜と、〜とを備えた○○」という構成要素列挙型の特許請求項で使われる手がかり句に対応するものであり、トークン「COMPOSE_R_CUE」は、「〜と、〜と、〜とを備え、〜し、〜し、〜する○○」という変形構成要素列挙型の特許請求項で使われる手がかり句に対応するものである。トークン「QUOTE_CUE」は、特許請求項の従属関係を示す記載の手がかり句に対応するものである。 In the surface layer clue information of the surface layer delimiter information in FIG. 3, the clue information described in a plurality of lines means that a corresponding token is given when any one of them corresponds. The token “JEPSON_CUE” corresponds to the clue phrase characteristic of the Jepson-type claim. The tokens “FEATURE_CUE” and “FEATURE_K_CUE” correspond to the cue phrase described in the claims. The token “COMPOSE_K_CUE” corresponds to the clue phrase used in the claim of the component enumeration type “XX with ˜, ˜, and ˜”, and the token “COMPOSE_R_CUE” , And, and corresponds to the clue phrase used in the claim of the modified component enumeration type of “. The token “QUIOTE_CUE” corresponds to the clue phrase described in the claims.
また、この具体例において、文節タイプ対応情報記憶部16では、図4で示される文節タイプ対応情報が記憶されているものとする。なお、図4の品詞の手がかり情報において、「X」は、名詞または記号である。記号は、句読点を含むものである。また、「Y」は、「体言接続特殊2」の動詞、または接頭詞である。また、図4の文節タイプ対応情報の品詞の手がかり情報において、複数行で記述している手がかり情報は、いずれか一つに該当した場合に、対応する文節タイプを付与することを意味している。例えば、動詞もしくは助動詞の連用形で終わる文節、または、動詞もしくは助動詞の基本形と、それに続く助詞「と共に」もしくは「とともに」で終わる文節には、文節タイプ「VPR」が付与されることを示している。また、図4の文節タイプには、区切文節タイプと、そうでないものとの両方が含まれるが、VPR_P,VPK_P,NPT_Pが、記述断片の区切を示す区切文節タイプである。また、VPK_Pは、終端区切文節タイプであり、VPR_P,NPT_Pは、継続区切文節タイプである。
In this specific example, it is assumed that the phrase type correspondence
まず、形態素解析部12は、記憶部11で記憶されている特許請求項情報に対して、行ごとに形態素解析を行い(すなわち、7回形態素解析を行うことになる)、行区切りの位置に「NEWLINE」を挿入した(ステップS101)。ここでは、形態素解析システム「MeCab」を用いた。その結果は、次の通りである。なお、形態素解析部12による形態素解析の結果は、記憶部11で記憶されることになる。次の結果において、前述のように、形態素ごとに、「見出し(表層)」、「品詞文字列」、「活用形」、「見出し(基本形)」、「2階層目の品詞」の5つの情報が得られる。
First, the
[形態素解析の結果]
画像 名詞 画像 一般
形成 名詞 形成 サ変接続
装置 名詞 装置 サ変接続
において 助詞 において 格助詞
、 記号 、 読点
NEWLINE
外部 名詞 外部 一般
に 助詞 に 格助詞
接続 名詞 接続 サ変接続
さ 動詞 未然レル接続 する 自立
れる 動詞 基本形 れる 接尾
ダクト 名詞 ダクト 一般
と 助詞 と 並立助詞
、 記号 、 読点
NEWLINE
エア 名詞 エア 一般
を 助詞 を 格助詞
排出 名詞 排出 サ変接続
する 動詞 基本形 する 自立
送風 名詞 送風 サ変接続
手段 名詞 手段 一般
と 助詞 と 並立助詞
、 記号 、 読点
NEWLINE
エア 名詞 エア 一般
を 助詞 を 格助詞
清浄 名詞 清浄 サ変接続
化 名詞 化 接尾
する 動詞 基本形 する 自立
清浄 名詞 清浄 サ変接続
化 名詞 化 接尾
手段 名詞 手段 一般
と 助詞 と 並立助詞
、 記号 、 読点
を 助詞 を 格助詞
備え 動詞 連用形 備える 自立
、 記号 、 読点
NEWLINE
前記 名詞 前記 サ変接続
ダクト 名詞 ダクト 一般
は 助詞 は 係助詞
内部 名詞 内部 一般
ダクト 名詞 ダクト 一般
を 助詞 を 格助詞
有し 動詞 連用形 有す 自立
、 記号 、 読点
NEWLINE
前記 名詞 前記 サ変接続
清浄 名詞 清浄 サ変接続
化 名詞 化 接尾
手段 名詞 手段 一般
は 助詞 は 係助詞
、 記号 、 読点
前記 名詞 前記 サ変接続
内部 名詞 内部 一般
ダクト 名詞 ダクト 一般
内 名詞 内 接尾
に 助詞 に 格助詞
設置 名詞 設置 サ変接続
さ 動詞 未然レル接続 する 自立
れ 動詞 連用形 れる 接尾
て 助詞 て 接続助詞
いる 動詞 基本形 いる 非自立
、 記号 、 読点
NEWLINE
こと 名詞 こと 非自立
を 助詞 を 格助詞
特徴 名詞 特徴 一般
と 助詞 と 格助詞
する 動詞 基本形 する 自立
画像 名詞 画像 一般
形成 名詞 形成 サ変接続
装置 名詞 装置 サ変接続
。 記号 。 句点
[Results of morphological analysis]
Image noun image general formation noun formation sa change connection device noun device in sa change connection particle in case particle, symbol, punctuation NEWLINE
External noun external in general case particle connected to case particle connected noun connected saber connected verb connected to self-relative self-standing verb basic formed suffix duct noun duct general and particle and parallel particle, symbol, punctuation NEWLINE
Air noun air in general particle in case particle discharge noun discharge insanely connected verb basic form self-sustained noun blast insane connecting means noun means general and particle and parallel particle, symbol, punctuation NEWLINE
Air noun air general particle as case particle cleansing noun purifier saber conjunctive nounization suffix verb basic form self-standing clean noun purifier savariant conjunctive nounization suffix means noun means general and particles and parallel particles, symbols and punctuation as particles Prepared Verb Consistent Provided Independence, Symbols, Readings NEWLINE
The above-mentioned nouns The above-mentioned change connection ducts Nouns Ducts General particles are co-inners Internal nouns Internal general ducts Nouns Ducts General particles have case particles Verbs Conjunctive forms Independence, Symbols, Readings NEWLINE
The above noun The above change connection cleanup Noun Clean The change connection Nounization Suffixing means Noun Meaning Generally, the particle is the particle, symbol, punctuation The above noun The inside change of the internal connection Noun Internal duct Noun Duct General internal noun In the suffix Noun Installation Sabari Connected Verb Naturally Connect Freestanding Verb Conjunctive Form Suffix Particles Conjunctive Verb Verbs Basic Forms Non Independent, Symbols, Readings NEWLINE
That noun that is independence particle is a case particle feature Noun feature General and particle and case particle Verb Basic form Autonomous image Noun image General formation Noun formation Change connection device Noun device Change connection. Sign. Punctuation
次に、トークン付与部15は、表層区切情報記憶部14で記憶されている図3で示される表層区切情報を用いて、形態素解析の結果に対して、トークンを付与する(ステップS102)。具体的には、トークン付与部15は、表層の手がかり情報を検索キーとして形態素解析の結果における見出し(表層)における検索を行い、ヒットしたところに、その表層の手がかり情報に対応するトークンを付与する。なお、トークンの付与の対象が2以上の形態素である場合には、その2以上の形態素を一つの集合(チャンク)として、それにトークンを付与する。また、トークン付与部15が付与したトークンも、記憶部11で記憶されることになる。この場合には、トークン「JEPSON_CUE」、「COMPOSE_R_CUE」、「FEATURE_K_CUE」が付与されている。
Next, the
[トークンの付与の結果]
画像 名詞 画像 一般
形成 名詞 形成 サ変接続
装置 名詞 装置 サ変接続
において、 JEPSON_CUE
NEWLINE
外部 名詞 外部 一般
に 助詞 に 格助詞
接続 名詞 接続 サ変接続
さ 動詞 未然レル接続 する 自立
れる 動詞 基本形 れる 接尾
ダクト 名詞 ダクト 一般
と 助詞 と 並立助詞
、 記号 、 読点
NEWLINE
エア 名詞 エア 一般
を 助詞 を 格助詞
排出 名詞 排出 サ変接続
する 動詞 基本形 する 自立
送風 名詞 送風 サ変接続
手段 名詞 手段 一般
と 助詞 と 並立助詞
、 記号 、 読点
NEWLINE
エア 名詞 エア 一般
を 助詞 を 格助詞
清浄 名詞 清浄 サ変接続
化 名詞 化 接尾
する 動詞 基本形 する 自立
清浄 名詞 清浄 サ変接続
化 名詞 化 接尾
手段 名詞 手段 一般
と 助詞 と 並立助詞
、 記号 、 読点
を備え、 COMPOSE_R_CUE
NEWLINE
前記 名詞 前記 サ変接続
ダクト 名詞 ダクト 一般
は 助詞 は 係助詞
内部 名詞 内部 一般
ダクト 名詞 ダクト 一般
を有し、 COMPOSE_R_CUE
NEWLINE
前記 名詞 前記 サ変接続
清浄 名詞 清浄 サ変接続
化 名詞 化 接尾
手段 名詞 手段 一般
は 助詞 は 係助詞
、 記号 、 読点
前記 名詞 前記 サ変接続
内部 名詞 内部 一般
ダクト 名詞 ダクト 一般
内 名詞 内 接尾
に 助詞 に 格助詞
設置 名詞 設置 サ変接続
さ 動詞 未然レル接続 する 自立
れ 動詞 連用形 れる 接尾
て 助詞 て 接続助詞
いる 動詞 基本形 いる 非自立
、 記号 、 読点
ことを特徴とする FEATURE_K_CUE
画像 名詞 画像 一般
形成 名詞 形成 サ変接続
装置 名詞 装置 サ変接続
。 記号 。 句点
[Result of token grant]
Image noun image general formation noun formation change connection device noun device change connection, JEPSON_CUE
NEWLINE
External noun external in general case particle connected to case particle connected noun connected saber connected verb connected to self-relative self-standing verb basic formed suffix duct noun duct general and particle and parallel particle, symbol, punctuation NEWLINE
Air noun air in general particle in case particle discharge noun discharge insanely connected verb basic form self-sustained noun blast insane connecting means noun means general and particle and parallel particle, symbol, punctuation NEWLINE
Air noun Air in general particle as case particle cleanup noun purifier saber conjunctive nounization suffix verb basic form self-standing clean noun purifier savariant conjunctive nounization suffix means noun means in general, particle, parallel particle, symbol, punctuation, COMPOSE_R_CUE
NEWLINE
Said noun said sagittal connection duct noun duct general particle is a particle inner noun internal general duct noun duct general, COMPOSE_R_CUE
NEWLINE
The above noun The above change connection cleanup Noun Clean The change connection Nounization Suffixing means Noun Meaning Generally, the particle is the particle, symbol, punctuation The above noun The inside change of the internal connection Noun Internal duct Noun Duct General internal noun In the suffix Noun installation Sabari connected Verb naturally connected to self-supporting verb Consecutive form Suffix particle and connected particle are verb Basic form is non-independent, symbolic and punctuation mark FEATURE_K_CUE
Image noun image general formation noun formation change connection device noun device change connection. Sign. Punctuation
その後、文節特定部13は、各形態素の「品詞文字列」、「活用形」、「2階層目の品詞」の情報と、図示しない記録媒体で記憶されている図5A,図5Bで示される状態遷移表を用いて、文節の区切位置を特定する(ステップS103)。なお、その際に、文節特定部13は、トークンの付与されている箇所については、その文節の区切位置の特定を行わないものとする。したがって、トークンの付与された箇所、及びそれに隣接する箇所については、文法上の文節の区切とは異なる場合もありうる。なお、この具体例では、文節特定部13は、文節の区切位置の直前の形態素に対して、区切の前であることを示す情報を付与するものとする。文節特定部13による文節の区切位置の特定の結果は、次の通りである。その結果において、文節の区切位置の直前の形態素には、区切の前であることを示す情報「◎」が付与されている。また、文節特定部13が特定した文節の区切位置を示す情報も、記憶部11で記憶されることになる。
Thereafter, the
[文節の区切位置の特定結果]
画像 名詞 画像 一般
形成 名詞 形成 サ変接続
装置 名詞 装置 サ変接続 ◎
において、 JEPSON_CUE ◎
NEWLINE
外部 名詞 外部 一般
に 助詞 に 格助詞 ◎
接続 名詞 接続 サ変接続
さ 動詞 未然レル接続 する 自立
れる 動詞 基本形 れる 接尾 ◎
ダクト 名詞 ダクト 一般
と 助詞 と 並立助詞
、 記号 、 読点 ◎
NEWLINE
エア 名詞 エア 一般
を 助詞 を 格助詞 ◎
排出 名詞 排出 サ変接続
する 動詞 基本形 する 自立 ◎
送風 名詞 送風 サ変接続
手段 名詞 手段 一般
と 助詞 と 並立助詞
、 記号 、 読点 ◎
NEWLINE
エア 名詞 エア 一般
を 助詞 を 格助詞 ◎
清浄 名詞 清浄 サ変接続
化 名詞 化 接尾 ◎
する 動詞 基本形 する 自立 ◎
清浄 名詞 清浄 サ変接続
化 名詞 化 接尾
手段 名詞 手段 一般
と 助詞 と 並立助詞
、 記号 、 読点 ◎
を備え、 COMPOSE_R_CUE ◎
NEWLINE
前記 名詞 前記 サ変接続
ダクト 名詞 ダクト 一般
は 助詞 は 係助詞 ◎
内部 名詞 内部 一般
ダクト 名詞 ダクト 一般 ◎
を有し、 COMPOSE_R_CUE ◎
NEWLINE
前記 名詞 前記 サ変接続
清浄 名詞 清浄 サ変接続
化 名詞 化 接尾
手段 名詞 手段 一般
は 助詞 は 係助詞
、 記号 、 読点 ◎
前記 名詞 前記 サ変接続
内部 名詞 内部 一般
ダクト 名詞 ダクト 一般
内 名詞 内 接尾
に 助詞 に 格助詞 ◎
設置 名詞 設置 サ変接続
さ 動詞 未然レル接続 する 自立
れ 動詞 連用形 れる 接尾
て 助詞 て 接続助詞
いる 動詞 基本形 いる 非自立
、 記号 、 読点 ◎
ことを特徴とする FEATURE_K_CUE ◎
画像 名詞 画像 一般
形成 名詞 形成 サ変接続
装置 名詞 装置 サ変接続
。 記号 。 句点 ◎
[Result of specifying the position of clause break]
Image noun image general formation noun formation change connection device noun device change connection ◎
In JEPSON_CUE ◎
NEWLINE
External noun External In general particle to case particle ◎
Connected Noun Connected Versatile Connected Verb Connected to Self-standing Verb Basic Formed Suffix ◎
Duct Noun Duct General and particle and parallel particle, symbol, reading ◎
NEWLINE
Air noun air general particle as case particle ◎
Ejected noun Ejected Verb Connected verb Basic form Independent ◎
Blowing noun Blowing change connection means Noun means General and particle and parallel particle, symbol, reading ◎
NEWLINE
Air noun air general particle as case particle ◎
Clean Noun Cleanliness Change Connection Nounization Suffix ◎
To verb basic form to independence ◎
Cleansing noun cleansing change connection nounization suffix means noun means general and particle and parallel particle, symbol, reading ◎
COMPOSE_R_CUE ◎
NEWLINE
The above-mentioned noun The above-mentioned variable connection duct Noun duct In general, the particle is the particle ◎
Internal Noun Internal General Duct Noun Duct General ◎
COMPOSE_R_CUE ◎
NEWLINE
The above nouns The above change connection cleanup Nouns Clean up change connection Nounization Suffixing means Noun means In general, the particle is a particle, symbol, punctuation mark ◎
The above nouns The above-mentioned internal connection inside nouns Internal general ducts Nouns Ducts General internal nouns Internal suffixes to particles and case particles ◎
Installation noun installation change verb connected to self-relative self-supporting verb conjunctive form suffixed particle connected verbal verb verb basic form non-independent, symbol, punctuation mark ◎
FEATURE_K_CUE ◎
Image noun image general formation noun formation change connection device noun device change connection. Sign. Punctuation ◎
次に、区切文節タイプ付与部17は、文節タイプ対応情報記憶部16で記憶されている図4で示される文節タイプ対応情報を用いて、文節の区切位置の特定結果に対して、文節タイプを付与する(ステップS104)。その際に、区切文節タイプ付与部17は、文節の末尾の形態素から1個以上の形態素を用いて、文節タイプの付与を行う。具体的には、区切文節タイプ付与部17は、品詞の手がかり情報に該当する文節を検索し、ヒットした文節に対して、その品詞の手がかり情報に対応する文節タイプを付与する。なお、この文節タイプの付与の後は、形態素解析の結果を用いないため、形態素解析の結果のうち、見出し(表層)以外の情報を消去してもよい。また、この文節タイプの付与の結果も、記憶部11で記憶されることになる。この場合には、文節タイプ「NP」や「PP」、「VPK」等が付与されている。
Next, using the phrase type correspondence information shown in FIG. 4 stored in the phrase type correspondence
[文節タイプの付与の結果]
画像形成装置 NP
において、 JEPSON_CUE
NEWLINE
外部に PP
接続される VPK
ダクトと、 NPT_P
NEWLINE
エアを NPO
排出する VPK
送風手段と、 NPT_P
NEWLINE
エアを NPO
清浄化 NP
する VPK
清浄化手段と、 NPT_P
を備え、 COMPOSE_R_CUE
NEWLINE
前記ダクトは PP
内部ダクト NP
を有し、 COMPOSE_R_CUE
NEWLINE
前記清浄化手段は、 PP
前記内部ダクト内に PP
設置されている、 VPK_P
ことを特徴とする FEATURE_K_CUE
画像形成装置。 NP
[Result of granting clause type]
Image forming device NP
In JEPSON_CUE
NEWLINE
PP outside
Connected VPK
Duct and NPT_P
NEWLINE
Air to NPO
VPK to discharge
Air blowing means, NPT_P
NEWLINE
Air to NPO
NP
VPK
Cleaning means and NPT_P
COMPOSE_R_CUE
NEWLINE
The duct is PP
Internal duct NP
COMPOSE_R_CUE
NEWLINE
The cleaning means is PP
PP inside the internal duct
VPK_P installed
FEATURE_K_CUE characterized by
Image forming apparatus. NP
この後、区切文節タイプ変更部18は、文節タイプの変更を行う(ステップS105)。その変更の具体的な方法は、次の通りである。なお、その方法の説明において、「名詞まとまり」とは名詞の連続である。その「名詞まとまり」は、文節タイプ「NP」の付与された文節であってもよく、文節タイプ「NPT」、「NPT_P」等の付与された文節に含まれる名詞の連続であってもよい。また、以下の説明において、トークンや文節タイプの付与された文節を、説明の便宜上、そのトークンや文節タイプそのもので表している。例えば、「VPR_P」は、厳密には、「VPR_Pの付与された文節」の意味である。
Thereafter, the delimiter clause
[文節タイプの変更の説明]
1.JEPSON_CUEが存在する場合は、以下の処理を行う。
(1)前半部(すなわち、特許請求項の先頭からJEPSON_CUEの直前までの部分)にFEATURE_CUE,FEATURE_K_CUE,COMPOSE_K_CUEのいずれかが存在する場合には、次の処理A、処理B、処理Cを行う。
(処理A)最後に出現したFEATURE_CUE,FEATURE_K_CUE,またはCOMPOSE_K_CUE以降の文節タイプをすべてHPに置き換える。
(処理B)COMPOSE_K_CUE,FEATURE_CUEの直前の「名詞まとまり」より前の部分、またはFEATURE_K_CUEより前の部分で、VPR_P,NPT_P,COMPOSE_R_CUE,または処理範囲(例えば、前半部の処理を行っている場合には前半部、後半部の処理を行っている場合には後半部、全体の処理を行っている場合には全体)の先頭のいずれかに遭遇するまでの間において、「名詞まとまり」の直前にVPKもしくはVPK_Pが存在していた場合、またはFEATURE_K_CUE直前にVPKもしくはVPK_Pが存在していた場合には、「名詞まとまり」の直前のVPKもしくはVPK_P以外と、FEATURE_K_CUEの直前のVPKもしくはVPK_P以外について、VPK*と、NP*をすべてPPに置き換える。
(処理C)処理Bにおいて、VPR_Pに遭遇した場合は、この処理を繰り返す。処理Bにおいて、NPT_Pに遭遇した場合は、それを含む「名詞まとまり」より前の部分で、この処理を繰り返す。処理Bにおいて、COMPOSE_R_CUEに遭遇した場合は、その直前の「名詞まとまり」より前の部分でこの処理を繰り返す。処理Bにおいて、処理範囲の先頭に遭遇した場合は、この処理を終了する。
(2)前半部に、FEATURE_CUE,FEATURE_K_CUE,COMPOSE_K_CUEのいずれも存在しない場合には、次の処理D、処理E、処理Fを行う。
(処理D)JEPSON_CUEの直前の「名詞まとまり」を認識し、それを構成する文節タイプをすべてHPに変更する。
(処理E)HPより前の部分で、VPR_P,NPT_P,COMPOSE_R_CUE,または処理範囲の先頭のいずれかに遭遇するまでの間において、HPの直前にVPKもしくはVPK_Pが存在していた場合には、HPの直前のVPKもしくはVPK_P以外について、VPK*と、NP*をすべてPPに置き換える。
(処理F)処理Eにおいて、VPR_Pに遭遇した場合は、この処理を繰り返す。処理Eにおいて、NPT_Pに遭遇した場合は、それを含む「名詞まとまり」より前の部分で、この処理を繰り返す。処理Eにおいて、COMPOSE_R_CUEに遭遇した場合は、その直前の「名詞まとまり」より前の部分でこの処理を繰り返す。処理Eにおいて、処理範囲の先頭に遭遇した場合は、この処理を終了する。
(3)前半部にNEWLINEが存在する場合には、次の処理Gを行う。
(処理G)NEWLINEが後続するVPKをVPK_Pに変更し、NEWLINEが後続するVPRをVPR_Pに変更し、NEWLINEが後続しないVPR_PをVPRに変更し、NEWLINEが後続しないVPK_PをVPKに変更する。
(4)後半部(すなわち、JEPSON_CUEの直後から特許請求項の終端までの部分)にFEATURE_CUE,FEATURE_K_CUE,COMPOSE_K_CUEのいずれかが存在する場合には、次の処理H,処理I、処理Jを行う。
(処理H)最後に出現したもの以降の文節タイプをすべてBPに置き換える。いずれも存在しない場合は、末尾の「名詞まとまり」を認識し、それを構成する文節タイプをすべてBPに置き換える。
(処理I)上記処理Bと同じ処理である。
(処理J)上記処理Cと同じ処理である。
(5)後半部に、FEATURE_CUE,FEATURE_K_CUE,COMPOSE_K_CUEのいずれも存在しない場合には、次の処理K、処理L、処理Mを行う。
(処理K)末尾の「名詞まとまり」を認識し、それを構成する文節タイプをすべてBPに変更する。
(処理L)上記処理Eにおいて、HPをBPに置き換えた処理を行う。
(処理M)上記処理Fにおいて、HPをBPに置き換えた処理を行う。
(6)後半部にNEWLINEが存在する場合には、上記処理Gを行う。
2.JEPSON_CUEが存在しない場合は、上記(4)〜(6)において後半部において行った処理を、特許請求項の全体に対して1回行う。
3.COMPOSE_K_CUE、COMPOSE_R_CUEの直前のNPTをNPT_Pに変更し、COMPOSE_K_CUE、COMPOSE_R_CUEの直前のNPをNPT_Pに変更する。
4.NEWLINEを除去する。
[Explanation of phrase type change]
1. When JEPSON_CUE exists, the following processing is performed.
(1) If any of FEATURE_CUE, FEATURE_K_CUE, COMPOSE_K_CUE exists in the first half (that is, the part from the beginning of the claims to immediately before JEPSON_CUE), the following processing A, processing B, and processing C are performed.
(Processing A) All clause types after FEATURE_CUE, FEATURE_K_CUE, or COMPOSE_K_CUE that appear last are replaced with HP.
(Processing B) VPR_P, NPT_P, COMPOSE_R_CUE, or processing range (for example, when processing of the first half is being performed in the part before the “noun group” immediately before COMPOSE_K_CUE, FEATURE_CUE, or the part before FEATURE_K_CUE VPK immediately before the “noun group” until the first half of the first half or the second half is processed, or the first half of the second half or the entire second when the entire process is performed. Alternatively, when VPK_P exists, or when VPK or VPK_P exists immediately before FEATURE_K_CUE, VP other than VPK or VPK_P immediately before “nouns” and other than VPK or VPK_P immediately before FEATURE_K_CUE, And K *, replace all the NP * PP.
(Process C) If VPR_P is encountered in Process B, this process is repeated. In the process B, when NPT_P is encountered, this process is repeated in a part before the “noun group” including the NPT_P. When the COMPOSE_R_CUE is encountered in the process B, this process is repeated in the part before the “noun group” immediately before. In the process B, when the head of the processing range is encountered, this process is terminated.
(2) When none of FEATURE_CUE, FEATURE_K_CUE, and COMPOSE_K_CUE exists in the first half, the following processing D, processing E, and processing F are performed.
(Process D) Recognize “noun group” immediately before JEPSON_CUE, and change all phrase types constituting it to HP.
(Processing E) If VPK or VPK_P exists immediately before HP before the HP encounters one of VPR_P, NPT_P, COMPOSE_R_CUE, or the head of the processing range before HP, HP VPK * and NP * are all replaced with PP except for VPK or VPK_P immediately before.
(Process F) When VPR_P is encountered in Process E, this process is repeated. In the process E, when NPT_P is encountered, this process is repeated in a part before the “noun group” including the NPT_P. In the process E, when COMPOSE_R_CUE is encountered, this process is repeated in the part before the “noun group” immediately before. In the process E, when the head of the processing range is encountered, this process is terminated.
(3) If NEWLINE exists in the first half, the next process G is performed.
(Process G) VPK followed by NEWLINE is changed to VPK_P, VPR followed by NEWLINE is changed to VPR_P, VPR_P not followed by NEWLINE is changed to VPR, and VPK_P not followed by NEWLINE is changed to VPK.
(4) If any of FEATURE_CUE, FEATURE_K_CUE, COMPOSE_K_CUE exists in the latter half (that is, the part immediately after JEPSON_CUE to the end of the claims), the following process H, process I, and process J are performed.
(Processing H) All phrase types after the last occurrence are replaced with BP. If none exists, the last “noun group” is recognized and all the phrase types constituting it are replaced with BP.
(Process I) The process is the same as the process B.
(Process J) This is the same process as Process C above.
(5) When none of FEATURE_CUE, FEATURE_K_CUE, and COMPOSE_K_CUE exists in the latter half, the following processing K, processing L, and processing M are performed.
(Processing K) Recognize the last “noun group” and change all the phrase types constituting it to BP.
(Process L) In the process E, the process of replacing HP with BP is performed.
(Process M) In the process F, the process of replacing HP with BP is performed.
(6) If NEWLINE exists in the latter half, the process G is performed.
2. When JEPSON_CUE does not exist, the processing performed in the latter half in the above (4) to (6) is performed once for the entire claim.
3. NPT immediately before COMPOSE_K_CUE and COMPOSE_R_CUE is changed to NPT_P, and NP immediately before COMPOSE_K_CUE and COMPOSE_R_CUE is changed to NPT_P.
4). Remove NEWLINE.
なお、上記の文節タイプの変更の説明において、処理Bや処理Eにおいて、VPK_P(終端区切文節タイプ)を、PPに置き換える処理が、終端区切文節タイプ(VPK_P)と、継続区切文節タイプ(VPR_P,NPT_P)との間に存在する終端区切文節タイプ(VPK_P)を削除する処理に対応する。また、処理Gにおいて、NEWLINEが後続しないVPR_PをVPRに変更し、NEWLINEが後続しないVPK_PをVPKに変更する処理が、改行が存在する場合であって、改行が後続しない動詞に関する区切文節タイプ(VPR_P,VPK_P)が存在する場合に、その区切文節タイプを削除する処理に対応する。
上記のようにして区切文節タイプ変更部18が変更した後の文節タイプは、次のようになる。
In the description of the phrase type change described above, in the process B and the process E, the process of replacing VPK_P (terminal delimiter phrase type) with PP is the terminal delimiter phrase type (VPK_P) and the continuation delimiter phrase type (VPR_P, This corresponds to the process of deleting the terminal delimiter clause type (VPK_P) existing between the NPT_P) and NPT_P). In process G, VPR_P that is not followed by NEWLINE is changed to VPR, and VPK_P that is not followed by NEWLINE is changed to VPK when there is a line break and the delimiter clause type (VPR_P) for a verb that does not follow a new line. , VPK_P) corresponds to the process of deleting the delimiter clause type.
The phrase type after the delimiter phrase
[文節タイプの変更の結果]
画像形成装置 HP
において、 JEPSON_CUE
外部に PP
接続される VPK
ダクトと、 NPT_P
エアを PP
排出する VPK
送風手段と、 NPT_P
エアを PP
清浄化 PP
する VPK
清浄化手段と、 NPT_P
を備え、 COMPOSE_R_CUE
前記ダクトは PP
内部ダクト NPT_P
を有し、 COMPOSE_R_CUE
前記清浄化手段は、 PP
前記内部ダクト内に PP
設置されている、 VPK_P
ことを特徴とする FEATURE_K_CUE
画像形成装置。 BP
[Result of phrase type change]
Image forming device HP
In JEPSON_CUE
PP outside
Connected VPK
Duct and NPT_P
PP for air
VPK to discharge
Air blowing means, NPT_P
PP for air
Cleaning PP
VPK
Cleaning means and NPT_P
COMPOSE_R_CUE
The duct is PP
Internal duct NPT_P
COMPOSE_R_CUE
The cleaning means is PP
PP inside the internal duct
VPK_P installed
FEATURE_K_CUE characterized by
Image forming apparatus. BP
その後、生成部19は、トークンと文節タイプとの付与された特許請求項情報から、請求項構造情報を生成する(ステップS106)。その生成において、この具体例では、その生成において、図6で示される文法ファイルを用いて、パーサジェネレータによって生成されたパーサ(構文解析器)を用いて、請求項構造情報を生成するものとする。なお、その図6の文法ファイルは、パーサジェネレータであるBison互換のPerl用ツールであるParse::Yapp(Francois Desarmenien,Parse−Yapp−1.05、http://search.cpan.org/dist/Parse−Yapp/)用の記述例である。特許請求項の記述は、通常、終端に定型的な表現が存在し、終端から先頭への方向で構造が確定することを考慮し、その文脈自由文法で記述した規則は、終端から先頭への方向で記述した。図6では、$retvalという変数に、生成されたXMLが文字列として格納される。図6で示される文法ファイルから生成されたパーサに、上記文節タイプの変更の結果を取り込むと、図7のXMLファイルで示される請求項構造情報が生成される。なお、その際、文脈自由文法から生成されたパーサには、文節タイプの変更の結果を、終端から先頭への方向に変換して入力する。また、XMLの構造としては、前述したPMLを使用した。
Thereafter, the
出力部20は、図7の請求項構造情報を読み込んでディスプレイに表示する。その結果、図8で示される、請求項構造情報に応じた記述断片の関係を示す表示が行われる(ステップS107)。この表示を見ることによって、ユーザは、特許請求項の構造を容易に把握することができるようになる。なお、図7で示されるXMLファイルから、図8で示される表示を生成する際にも、構文解析器(パーサ)が用いられてもよい。このパーサは、マークアップ言語で記述された構造を表示する公知のパーサである。
The
ここで、上記の文節タイプの変更の結果から、記述断片の間の係り受けを示す請求項構造情報を生成する別の処理の具体例について、簡単に説明する。文節タイプの変更の結果において、JEPSON_CUE以外の各トークンと、NPT_Pと、BPとは、それだけで一つの記述断片となる。すなわち、JEPSON_CUE以外の各トークンと、NPT_Pと、BPとについては、その前後に記述断片の区切位置が来ることになる。また、VPR_Pと、VPK_Pとは、それらの直前に連続する0個以上のPPやVPR,VPKを含んで一つの記述断片となる。すなわち、VPR_Pと、VPK_Pとについては、その後に記述断片の区切位置が来ることになる。また、HPとJEPSON_CUEとは、両方で一つの記述断片となる。すなわち、「HP+JEPSON_CUE」については、その前後に記述断片の区切位置が来ることになる。残った連続する1以上のPPやVPR,VPKも、一つの記述断片となる。このような、トークン及び区切文節タイプに対応した記述断片の区切位置を示す情報を用いることによって、生成部19は、記述断片の区切位置を特定することができることになる。そのようにして、文節タイプの変更の結果を記述断片ごとに示し、その記述断片に対して、最後の文節に対応する文節タイプを対応付けた結果は、次のようになる。
Here, a specific example of another process for generating the claim structure information indicating the dependency between the description fragments from the result of the change in the phrase type will be briefly described. As a result of the phrase type change, each token other than JEPSON_CUE, NPT_P, and BP alone become one description fragment. That is, for each token other than JEPSON_CUE, NPT_P, and BP, the delimiter position of the description fragment comes before and after the token. Further, VPR_P and VPK_P are one description fragment including zero or more PPs, VPRs, and VPKs immediately preceding them. That is, for VPR_P and VPK_P, the delimiter position of the description fragment follows. Further, both HP and JEPSON_CUE become one description fragment. That is, for “HP + JEPSSON_CUE”, the delimiter position of the description fragment comes before and after that. The remaining one or more continuous PPs, VPRs, and VPKs also become one description fragment. By using such information indicating the delimitation position of the description fragment corresponding to the token and delimiter clause type, the
画像形成装置において、 JEPSON_CUE
外部に接続される VPK
ダクトと、 NPT_P
エアを排出する VPK
送風手段と、 NPT_P
エアを清浄化する VPK
清浄化手段と、 NPT_P
を備え、 COMPOSE_R_CUE
前記ダクトは PP
内部ダクト NPT_P
を有し、 COMPOSE_R_CUE
前記清浄化手段は、前記内部ダクト内に設置されている、 VPK_P
ことを特徴とする FEATURE_K_CUE
画像形成装置。 BP
In the image forming apparatus, JEPSON_CUE
VPK connected to outside
Duct and NPT_P
VPK that discharges air
Air blowing means, NPT_P
VPK to clean air
Cleaning means and NPT_P
COMPOSE_R_CUE
The duct is PP
Internal duct NPT_P
COMPOSE_R_CUE
The cleaning means is installed in the internal duct, VPK_P
FEATURE_K_CUE characterized by
Image forming apparatus. BP
また、トークンの付与された記述断片及び区切文節タイプの付与された記述断片の係り受け関係が次のように定められているものとする。前半部と、後半部または全体とに分けて説明する。なお、以下の説明において、トークンの付与された記述断片や、文節タイプの付与された記述断片を、説明の便宜上、そのトークンや文節タイプそのもので表している。例えば、「COMPOSE_K_CUE」は、厳密には、「COMPOSE_K_CUEの付与された記述断片」の意味である。 Further, it is assumed that the dependency relationship between the description fragment to which the token is assigned and the description fragment to which the delimiter clause type is assigned is defined as follows. The description will be divided into the first half and the second half or the whole. In the following description, a description fragment to which a token is assigned or a description fragment to which a phrase type is assigned is represented by the token or the phrase type itself for convenience of explanation. For example, “COMPOSE_K_CUE” strictly means “descriptive fragment to which COMPOSE_K_CUE is assigned”.
(前半部)
COMPOSE_K_CUEは、それよりも後に存在する、それに最も近い、JEPSON_CUE、FEATURE_CUE、または、FEATURE_K_CUEに係る。
COMPOSE_R_CUEは、それよりも後に存在する、それに最も近い、JEPSON_CUE、FEATURE_CUE、または、FEATURE_K_CUEに係る。
FEATURE_CUEは、JEPSON_CUEに係る。
FEATURE_K_CUEは、JEPSON_CUEに係る。
NPT_Pは、それよりも後に存在する、それに最も近い、COMPOSE_K_CUEまたはCOMPOSE_R_CUEに係る。
VPKは、直後の記述断片に係る。
VPK_Pは、直後の記述断片に係る。
VPRは、それよりも後に存在する、それに最も近い、VPK(またはVPK_P)の直後の記述断片に係る。
VPR_Pは、それよりも後に存在する、それに最も近い、VPK(またはVPK_P)の直後の記述断片に係る。
PPは、直後の記述断片に係る。
(後半部、または全体)
JEPSON_CUEは、BPに係る。
COMPOSE_K_CUEは、それよりも後に存在する、それに最も近い、BP、FEATURE_CUE、または、FEATURE_K_CUEに係る。
COMPOSE_R_CUEは、それよりも後に存在する、それに最も近い、BP、FEATURE_CUE、または、FEATURE_K_CUEに係る。
FEATURE_CUEは、BPに係る。
FEATURE_K_CUEは、BPに係る。
NPT_Pは、それよりも後に存在する、それに最も近い、COMPOSE_K_CUEまたはCOMPOSE_R_CUEに係る。
VPKは、直後の記述断片に係る。
VPK_Pは、直後の記述断片に係る。
VPRは、それよりも後に存在する、それに最も近い、VPK(またはVPK_P)の直後の記述断片に係る。
VPR_Pは、それよりも後に存在する、それに最も近い、VPK(またはVPK_P)の直後の記述断片に係る。
PPは、直後の記述断片に係る。
(First half)
COMPOSE_K_CUE relates to JEPSON_CUE, FEATURE_CUE, or FEATURE_K_CUE that is closest to and exists after that.
COMPOSE_R_CUE relates to JEPSON_CUE, FEATURE_CUE, or FEATURE_K_CUE that is closest to and exists after that.
FEATURE_CUE relates to JEPSON_CUE.
FEATURE_K_CUE relates to JEPSON_CUE.
NPT_P relates to COMPOSE_K_CUE or COMPOSE_R_CUE that is closest to and exists after that.
VPK relates to the description fragment immediately after.
VPK_P relates to the immediately following description fragment.
The VPR relates to the description fragment immediately after the VPK (or VPK_P) that exists after that and is closest to it.
VPR_P relates to a description fragment immediately after VPK (or VPK_P) that is present and closest to VPR_P.
PP relates to the immediately following description fragment.
(Second half or whole)
JEPSON_CUE relates to BP.
COMPOSE_K_CUE relates to BP, FEATURE_CUE, or FEATURE_K_CUE that is closest to and exists after that.
COMPOSE_R_CUE relates to BP, FEATURE_CUE, or FEATURE_K_CUE that is closest to and exists after that.
FEATURE_CUE relates to BP.
FEATURE_K_CUE relates to BP.
NPT_P relates to COMPOSE_K_CUE or COMPOSE_R_CUE that is closest to and exists after that.
VPK relates to the description fragment immediately after.
VPK_P relates to the immediately following description fragment.
The VPR relates to the description fragment immediately after the VPK (or VPK_P) that exists after that and is closest to it.
VPR_P relates to a description fragment immediately after VPK (or VPK_P) that is present and closest to VPR_P.
PP relates to the immediately following description fragment.
生成部19は、あらかじめ規定されているトークンの付与された記述断片及び区切文節タイプの付与された記述断片の係り受け関係の情報(図示しない記録媒体で記憶されていてもよい)を用いることによって、各記述断片の係り受け関係を特定することができる。この例の場合には、各記述断片の係り先を特定することができることになる。これが次で示される請求項構造情報となる。なお、その請求項構造情報において、「記述断片ID」、「記述断片の文字列」、「記述断片に対応するトークンまたは文節タイプ」、「係り先の記述断片ID」の順で表示している。
The
[請求項構造情報]
1 画像形成装置において、 JEPSON_CUE 14
2 外部に接続される VPK 3
3 ダクトと、 NPT_P 8
4 エアを排出する VPK 5
5 送風手段と、 NPT_P 8
6 エアを清浄化する VPK 7
7 清浄化手段と、 NPT_P 8
8 を備え、 COMPOSE_R_CUE 13
9 前記ダクトは PP 10
10 内部ダクト NPT_P 11
11 を有し、 COMPOSE_R_CUE 13
12 前記清浄化手段は、前記内部ダクト内に設置されている、 VPK_P 13
13 ことを特徴とする FEATURE_K_CUE 14
14 画像形成装置。 BP
[Claim structure information]
1 In the image forming apparatus,
2 VPK connected to outside 3
3 Duct and
4 Discharge air VPK 5
5 blowing means and
6 VPK to clean air 7
7 Cleaning means and
8 and
9 The duct is PP 10
10
11 and
12 The cleaning means is installed in the internal duct,
13
14 Image forming apparatus. BP
出力部20が、この請求項構造情報を記述断片の係り受けを示すように表示すると、図8の表示となる。なお、係り受け関係を有する複数の情報を表示する方法としては、例えば、自然言語処理における係り受け関係を表示するソフトウェアや、クレームツリーの表示ソフトウェア等としてすでに知られており、その詳細な説明を省略する。
When the
なお、QUOTE_CUEについては特に言及しなかったが、QUOTE_CUEが存在する場合には、その直前の位置で記述断片の区切位置が存在することになる。また、そのQUOTE_CUEを先頭に含む記述断片は、前半部においてはJEPSON_CUEの記述断片に係り、後半部においては、BPに係ることになる。このようにして、QUOTE_CUEが含まれる場合にも、記述断片への分割と、その係り受け関係の特定とを行うことができるようになる。 Note that QUIOTE_CUE was not particularly mentioned, but when QUIOTE_CUE exists, the delimiter position of the description fragment exists at the position immediately before it. Further, the description fragment including the QUIOTE_CUE at the head is related to the description fragment of JEPSON_CUE in the first half, and is related to BP in the second half. In this way, even when QUEOTE_CUE is included, it is possible to divide into description fragments and specify the dependency relationship.
以上のように、本実施の形態による請求項構造情報生成装置1によれば、表層の手がかり情報と、品詞の手がかり情報とを用いて、文節単位で記述断片の区切位置を検出するため、より深い構造を持つ特許請求項についても構造解析を適切に行うことができるようになる。特に、品詞の手がかり情報を用いることによって、区切位置となりうるすべての箇所を見つけることができるようになる。なお、そのようにして見つけた区切位置には、本来は区切位置とすべきでない箇所も含まれてしまう場合もある。したがって、区切文節タイプ変更部18による文節タイプの変更、特に区切文節タイプの削除を行うことによって、そのような適切でない区切位置を削除することによって、本来の記述断片を取得することができるようになる。なお、従来例では、文節よりも細かい形態素単位で記述断片の区切位置の検出等を行っていたため、大まかな解析しかすることができなかった。扱う単位が細かいため、細かい解析を行うことは非常に困難だからである。一方、本実施の形態では、文節単位で記述断片の区切位置の検出等を行うため、従来例よりも細かい解析を行うことができるようになり、その結果、より深い構造を持った請求項についても、適切な解析を行うことができるようになった。このようにして、従来例では図16の程度にしか解析することができなかったものを、本実施の形態では、図8のように細かく解析することができるようになった。
As described above, according to the claim structure
また、本実施の形態において、従属関係に対応する表層の手がかり情報をも用いることによって、他の請求項に従属する請求項についても、その構造を適切に解析することができ、その請求項に対応した請求項構造情報を生成することができる。 Further, in the present embodiment, by using the surface layer clue information corresponding to the dependency relationship, the structure of a claim dependent on another claim can be analyzed appropriately. Corresponding claim structure information can be generated.
なお、本実施の形態による請求項構造情報生成装置1において、構成要素の親子関係に関する構造の解析をさらに行ってもよい。この場合には、区切文節タイプに、前述の構成要素の包含関係を示すトークンに対して、親の構成要素に応じた区切文節タイプである親区切文節タイプと、構成要素の包含関係を示すトークンに対して、子の構成要素に応じた区切文節タイプである子区切文節タイプと、が存在するものとする。構成要素の包含関係を示すトークンは、例えば、既出のCOMPOSE_K_CUEやCOMPOSE_R_CUEである。また、親区切文節タイプは、例えば、既出のHPやBP、ここで定義するNPH、NPH_P等である。また、子区切文節タイプは、例えば、既出のNPT_Pである。
In addition, in the claim structure
文節タイプ対応情報において、区切文節タイプNPH、NPH_Pに対応する品詞の手がかり情報は、例えば、次のようになる。
NPH:X+助詞「は」
NPH_P:X+助詞「は」+「記号−読点(「、」または「,」)」
すなわち、例えば、前述の具体例の場合には、「前記ダクトは」がNPHとなる。
In the phrase type correspondence information, the part-of-speech clue information corresponding to the delimited phrase types NPH and NPH_P is, for example, as follows.
NPH: X + particle "ha"
NPH_P: X + particle "ha" + "symbol-punctuation (", "or", ")"
That is, for example, in the above-described specific example, “the duct” is NPH.
このような場合において、出力部20は、親区切文節タイプに対応する記述断片と、子区切文節タイプに対応する記述断片との親子関係が分かるように両記述断片を表示してもよい。例えば、出力部20は、親区切文節タイプに対応する記述断片と、子区切文節タイプに対応する記述断片とを線で結んで表示してもよい。なお、その親区切文節タイプに対応する記述断片と、子区切文節タイプに対応する記述断片との間に、構成要素の包含関係に関する記述断片が存在してもよい。すなわち、親区切文節タイプに対応する記述断片と、子区切文節タイプに対応する記述断片とは、構成要素の包含関係に関する記述断片を介して線で結ばれてもよい。また、出力部20は、結果としてそのような表示を行えばよく、例えば、親区切文節タイプに対応する記述断片と、子区切文節タイプに対応する記述断片とが直接的にまたは間接的に係り受け関係にあることを示す請求項構造情報が生成されている場合には、それを本実施の形態で説明したように表示するだけであってもよい。
In such a case, the
ここで、具体例を用いて説明する。
(α)文節タイプの変更の際には、前述の具体例の変更を行うと共に、その変更の後に、次の処理を行うものとする。
(β)NPHの後に、COMPOSE_K_CUEまたはCOMPOSE_R_CUEが存在しない場合には、NPHをPPに変更する。
(γ)NPHと、それよりも後に存在する、それに最も近い、COMPOSE_K_CUEまたはCOMPOSE_R_CUEとの間に、NPT_Pが存在しない場合には、NPHをPPに変更する。
(δ)NPHと、それよりも後に存在する、それに最も近い、NPT_Pとの間に、VPR_Pが存在する場合には、NPHを、PPに変更する。
(ε)NPH_Pについても、NPHをNPH_Pに置き換えて、上記(β)〜(δ)の処理を行う。
Here, it demonstrates using a specific example.
(Α) When changing the phrase type, the specific example described above is changed, and the following processing is performed after the change.
(Β) If COMPOSE_K_CUE or COMPOSE_R_CUE does not exist after NPH, NPH is changed to PP.
(Γ) If NPT_P does not exist between NPH and COMPOSE_K_CUE or COMPOSE_R_CUE that is present and closest to NPH, change NPH to PP.
(Δ) If VPR_P exists between NPH and NPT_P that is present and closest to NPH, NPH is changed to PP.
(Ε) NPH_P is also replaced with NPH_P and the processes (β) to (δ) are performed.
上記(α)〜(δ)の処理を行うことによって、文節タイプの変更の結果は次のようになる。
[文節タイプの変更の結果]
画像形成装置 HP
において、 JEPSON_CUE
外部に PP
接続される VPK
ダクトと、 NPT_P
エアを PP
排出する VPK
送風手段と、 NPT_P
エアを PP
清浄化 PP
する VPK
清浄化手段と、 NPT_P
を備え、 COMPOSE_R_CUE
前記ダクトは NPH
内部ダクト NPT_P
を有し、 COMPOSE_R_CUE
前記清浄化手段は、 PP
前記内部ダクト内に PP
設置されている、 VPK_P
ことを特徴とする FEATURE_K_CUE
画像形成装置。 BP
By performing the processes (α) to (δ), the result of the phrase type change is as follows.
[Result of phrase type change]
Image forming device HP
In JEPSON_CUE
PP outside
Connected VPK
Duct and NPT_P
PP for air
VPK to discharge
Air blowing means, NPT_P
PP for air
Cleaning PP
VPK
Cleaning means and NPT_P
COMPOSE_R_CUE
The duct is NPH
Internal duct NPT_P
COMPOSE_R_CUE
The cleaning means is PP
PP inside the internal duct
VPK_P installed
FEATURE_K_CUE characterized by
Image forming apparatus. BP
次に、記述断片の区切位置の特定の際には、NPH、NPH_Pも一つの記述断片になるとする。すなわち、NPHと、NPH_Pとについては、その前後に記述断片の区切位置が来ることになる。また、あらかじめ規定されている係り受け関係に、次のNPH、NPH_Pの係り先の関係を追加し、COMPOSE_K_CUEまたはCOMPOSE_R_CUEの係り先の関係を次のように変更する。 Next, it is assumed that NPH and NPH_P also become one description fragment when specifying the delimiter position of the description fragment. That is, for NPH and NPH_P, description fragment delimiters come before and after the NPH and NPH_P. Further, the relationship of the next NPH and NPH_P is added to the predetermined dependency relationship, and the relationship of the COMPOSE_K_CUE or COMPOSE_R_CUE is changed as follows.
(前半部)
(追加)NPHは、それよりも後に存在する、それに最も近い、JEPSON_CUE、FEATURE_CUE、または、FEATURE_K_CUEに係る。
(追加)NPH_Pは、それよりも後に存在する、それに最も近い、JEPSON_CUE、FEATURE_CUE、または、FEATURE_K_CUEに係る。
(変更)COMPOSE_K_CUEは、それよりも前にNPHまたはNPH_Pが存在する場合には、そのCOMPOSE_K_CUEよりも前に存在する、それに最も近いNPHまたはNPH_Pに係り、そのCOMPOSE_K_CUEよりも前にNPH及びNPH_Pが存在しない場合には、そのCOMPOSE_K_CUEよりも後に存在する、それに最も近い、JEPSON_CUE、FEATURE_CUE、または、FEATURE_K_CUEに係る。
(変更)COMPOSE_R_CUEは、それよりも前にNPHまたはNPH_Pが存在する場合には、そのCOMPOSE_R_CUEよりも前に存在する、それに最も近いNPHまたはNPH_Pに係り、そのCOMPOSE_R_CUEよりも前にNPH及びNPH_Pが存在しない場合には、そのCOMPOSE_R_CUEよりも後に存在する、それに最も近い、JEPSON_CUE、FEATURE_CUE、または、FEATURE_K_CUEに係る。
(後半部、または全体)
(追加)NPHは、それよりも後に存在する、それに最も近い、BP、FEATURE_CUE、または、FEATURE_K_CUEに係る。
(追加)NPH_Pは、それよりも後に存在する、それに最も近い、BP、FEATURE_CUE、または、FEATURE_K_CUEに係る。
(変更)COMPOSE_K_CUEは、それよりも前にNPHまたはNPH_Pが存在する場合には、そのCOMPOSE_K_CUEよりも前に存在する、それに最も近いNPHまたはNPH_Pに係り、そのCOMPOSE_K_CUEよりも前にNPH及びNPH_Pが存在しない場合には、そのCOMPOSE_K_CUEよりも後に存在する、それに最も近い、BP、FEATURE_CUE、または、FEATURE_K_CUEに係る。
(変更)COMPOSE_R_CUEは、それよりも前にNPHまたはNPH_Pが存在する場合には、そのCOMPOSE_R_CUEよりも前に存在する、それに最も近いNPHまたはNPH_Pに係り、そのCOMPOSE_R_CUEよりも前にNPH及びNPH_Pが存在しない場合には、そのCOMPOSE_R_CUEよりも後に存在する、それに最も近い、BP、FEATURE_CUE、または、FEATURE_K_CUEに係る。
(First half)
(Addition) NPH is related to JEPSON_CUE, FEATURE_CUE, or FEATURE_K_CUE that is closest to and exists after that.
(Addition) NPH_P relates to JEPSON_CUE, FEATURE_CUE, or FEATURE_K_CUE that is present closest to the NPH_P.
(Change) If COMPE_K_CUE has NPH or NPH_P before it, it is related to NPH or NPH_P that is closest to that COMPOSE_K_CUE, and NPH and NPH_P exist before that COMPOSE_K_CUE If not, it relates to JEPSON_CUE, FEATURE_CUE, or FEATURE_K_CUE that is closest to and exists after that COMPOSE_K_CUE.
(Change) When COMPOSE_R_CUE has NPH or NPH_P before it, it is related to NPH or NPH_P that is closest to that COMPOSE_R_CUE, and has NPH and NPH_P before that COMPOSE_R_CUE. If not, it is related to JEPSON_CUE, FEATURE_CUE, or FEATURE_K_CUE which is present after that COMPOSE_R_CUE and is closest thereto.
(Second half or whole)
(Addition) NPH is related to BP, FEATURE_CUE, or FEATURE_K_CUE that is closest to and exists after that.
(Addition) NPH_P relates to BP, FEATURE_CUE, or FEATURE_K_CUE that is present and closest to it.
(Change) If COMPE_K_CUE has NPH or NPH_P before it, it is related to NPH or NPH_P that is closest to that COMPOSE_K_CUE, and NPH and NPH_P exist before that COMPOSE_K_CUE If not, it relates to BP, FEATURE_CUE, or FEATURE_K_CUE that is closest to and exists after that COMPOSE_K_CUE.
(Change) When COMPOSE_R_CUE has NPH or NPH_P before it, it is related to NPH or NPH_P that is closest to that COMPOSE_R_CUE, and has NPH and NPH_P before that COMPOSE_R_CUE. If not, it is related to BP, FEATURE_CUE, or FEATURE_K_CUE which is present after that COMPOSE_R_CUE and is closest thereto.
このような係り受け関係に応じて請求項構造情報を生成すると、次のようになる。
[請求項構造情報]
1 画像形成装置において、 JEPSON_CUE 14
2 外部に接続される VPK 3
3 ダクトと、 NPT_P 8
4 エアを排出する VPK 5
5 送風手段と、 NPT_P 8
6 エアを清浄化する VPK 7
7 清浄化手段と、 NPT_P 8
8 を備え、 COMPOSE_R_CUE 13
9 前記ダクトは NPH 13
10 内部ダクト NPT_P 11
11 を有し、 COMPOSE_R_CUE 9
12 前記清浄化手段は、前記内部ダクト内に設置されている、 VPK_P 13
13 ことを特徴とする FEATURE_K_CUE 14
14 画像形成装置。 BP
When the claim structure information is generated according to such a dependency relationship, it is as follows.
[Claim structure information]
1 In the image forming apparatus,
2 VPK connected to outside 3
3 Duct and
4 Discharge air VPK 5
5 blowing means and
6 VPK to clean air 7
7 Cleaning means and
8 and
9 The duct is
10
11 and COMPOSE_R_CUE 9
12 The cleaning means is installed in the internal duct,
13
14 Image forming apparatus. BP
また、出力部20が、この請求項構造情報を表示すると、例えば、図9で示されるようになる。図9では、親子関係のある構成要素の記述断片が、「を備え、」や「ことを特徴とする」、または、「を有し、」を介して、接続されることになる。例えば、「ダクトと、」、「送風手段と、」、「清浄化手段と、」が、「を備え、」等を介して「画像形成装置。」に接続されていることによって、「画像形成装置。」が、「ダクトと、」、「送風手段と、」、「清浄化手段と、」を構成要素として有することが分かる。また、「内部ダクト」が、「を有し、」を介して「前記ダクトは」に接続されていることによって、「前記ダクトは」が、「内部ダクト」を構成要素として有することが分かる。
Further, when the
なお、出力部20は、構成要素に関する複数の記述断片のうち、語幹が同じものを共通化して表示してもよい。記述断片の語幹とは、末尾の句読点や助詞、または、先頭の「前記」、「上記」、「当該」、「該」、「その」等の、既出のものを示す接頭語を記述断片から除去した部分である。したがって、「前記ダクトは」と、「ダクトと、」とは、語幹「ダクト」が共通することになる。その共通化する場合に、語幹が共通する複数の記述断片のうち、先頭の記述断片に他の記述断片を統合してもよく、または、COMPOSE_K_CUEもしくはCOMPOSE_R_CUEに係る記述断片に他の記述断片を統合してもよい。その結果、例えば、図10で示される表示がなされる。ここでは、出力部20がそのような出力を行う場合について説明したが、生成部19が、そのような請求項構造情報を生成してもよい。例えば、前述の例の場合には、請求項構造情報において、構成要素に関する記述断片は、NPT_P、NPH、NPH_Pであるため、それらの語幹が共通するかどうか判断する。この場合には、「ダクトと、」、「前記ダクトは」の語幹が共通すると判断される。その結果、2番目以降の記述断片「前記ダクトは」に係る記述断片「を有し、」の係り先を、1番目の記述断片「ダクトと、」に変更すると共に、2番目以降の記述断片「前記ダクトは」を削除すればよいことになる。その結果、請求項構造情報が、次のようになる。
Note that the
[請求項構造情報]
1 画像形成装置において、 JEPSON_CUE 14
2 外部に接続される VPK 3
3 ダクトと、 NPT_P 8
4 エアを排出する VPK 5
5 送風手段と、 NPT_P 8
6 エアを清浄化する VPK 7
7 清浄化手段と、 NPT_P 8
8 を備え、 COMPOSE_R_CUE 13
10 内部ダクト NPT_P 11
11 を有し、 COMPOSE_R_CUE 3
12 前記清浄化手段は、前記内部ダクト内に設置されている、 VPK_P 13
13 ことを特徴とする FEATURE_K_CUE 14
14 画像形成装置。 BP
[Claim structure information]
1 In the image forming apparatus,
2 VPK connected to outside 3
3 Duct and
4 Discharge air VPK 5
5 blowing means and
6 VPK to clean air 7
7 Cleaning means and
8 and
10
11 and
12 The cleaning means is installed in the internal duct,
13
14 Image forming apparatus. BP
この例では、一つの請求項において、語幹の共通する、構成要素に関する記述断片をまとめる場合について説明したが、従属関係にある請求項において、そのことを行ってもよい。例えば、上記例の請求項に従属する請求項において、「……前記送風手段は、羽根と、前記羽根を回転させるモータとを備え、……」という記載があった場合に、上記例の請求項における記述断片「送風手段と、」に対して、記述断片「羽根と、」、「モータと」が係るように表示してもよい。 In this example, a case has been described in which description fragments relating to constituent elements that share a common word stem are collected in one claim, but this may be performed in a dependent claim. For example, in a claim dependent on the claim of the above example, when there is a description that "... the air blowing means includes a blade and a motor that rotates the blade, ..." The description fragment “blade” and “motor” may be displayed with respect to the description fragment “with air blowing means” in the section.
なお、本実施の形態による請求項構造情報生成装置1において、親区切文節タイプや、子区切文節タイプを用いて、構成要素の親子関係を取得するようにしてもよい。その場合には、請求項構造情報生成装置1は、図11で示されるように、親子関係取得部21と、階層レベル取得部22とをさらに備えてもよい。
In the claim structure
親子関係取得部21は、親区切文節タイプと子区切文節タイプとの付与された特許請求項情報を用いて、構成要素の親子関係を取得する。具体的には、ある構成要素の包含関係を示すトークンに対する親区切文節タイプに対応する文節の構成要素は、親の構成要素であり、その同じトークンに対する子区切文節タイプに対応する文節の構成要素は、子の構成要素である。したがって、その構成要素の包含関係を示すトークンを介在させることによって、構成要素の親子関係を取得することができる。その親子関係は、例えば、親である画像形成装置に対応する子が、ダクト、送風手段、清浄化手段であることを示す情報であってもよい。この例のように、説明の便宜上、装置なども構成要素と呼ぶことにする。また、記述断片から構成要素を特定する方法は、前述の語幹を特定する方法と同様であり、その説明を省略する。その親子関係を示す情報は、図示しない記録媒体において記憶されてもよい。
The parent-child
階層レベル取得部22は、親子関係取得部21が取得した構成要素の親子関係を用いて、構成要素の階層レベルを取得する。親子関係から階層レベルを取得する方法は公知であるが、その一例を簡単に説明しておく。なお、ここでは、最も高い階層レベル(それに対する親の存在しない階層レベル)を「1」として、階層が深くなるほど、階層レベルの値が大きくなるものとする。まず、親子関係から、すべての構成要素を取得し、ユニーク処理を行う。そして、各構成要素のうち、親のない構成要素に対して、階層レベル1を付与する。その階層レベル1の構成要素を親に持つすべての構成要素に対して、階層レベル2を付与する。このように、階層レベルNの構成要素を親に持つすべての構成要素に対して、階層レベル(N+1)を付与する処理を、階層レベルの付与されていない構成要素がなくなるまで継続する。その結果、すべての構成要素の階層レベルを知ることができるようになる。その構成要素ごとの階層レベルを示す情報は、図示しない記録媒体において記憶されてもよい。
The hierarchy
また、出力部20は、階層レベル取得部22が取得した階層レベルに応じて、親区切文節タイプ及び子区切文節タイプに対応する記述断片を表示してもよい。「階層レベルに応じて記述断片を表示する」とは、例えば、階層レベルを示す数値等を、記述断片に対応付けて表示することであってもよく、あるいは、階層レベルに応じた表示位置(例えば、階層レベルが高いほど左(または上)に表示され、階層レベルが低いほど右(または下)に表示されてもよい)となるように記述断片を表示することであってもよい。
In addition, the
ここで、具体例を用いて説明する。
なお、請求項構造情報が生成されるまでの処理は、前述の処理と同様であり、その説明を省略する。その請求項構造情報は、次の通りであるとする。
Here, it demonstrates using a specific example.
The process until the claim structure information is generated is the same as the process described above, and the description thereof is omitted. The claim structure information is as follows.
[請求項構造情報]
1 画像形成装置において、 JEPSON_CUE 14
2 外部に接続される VPK 3
3 ダクトと、 NPT_P 8
4 エアを排出する VPK 5
5 送風手段と、 NPT_P 8
6 エアを清浄化する VPK 7
7 清浄化手段と、 NPT_P 8
8 を備え、 COMPOSE_R_CUE 13
9 前記ダクトは NPH 13
10 内部ダクト NPT_P 11
11 を有し、 COMPOSE_R_CUE 9
12 前記清浄化手段は、前記内部ダクト内に設置されている、 VPK_P 13
13 ことを特徴とする FEATURE_K_CUE 14
14 画像形成装置。 BP
[Claim structure information]
1 In the image forming apparatus,
2 VPK connected to outside 3
3 Duct and
4 Discharge air VPK 5
5 blowing means and
6 VPK to clean air 7
7 Cleaning means and
8 and
9 The duct is
10
11 and COMPOSE_R_CUE 9
12 The cleaning means is installed in the internal duct,
13
14 Image forming apparatus. BP
親子関係取得部21は、COMPOSE_K_CUEまたはCOMPOSE_R_CUEごとに、親子関係を取得するものとする。COMPOSE_K_CUEまたはCOMPOSE_R_CUEよりも前に、NPHまたはNPH_Pが存在する場合には、そのCOMPOSE_K_CUEまたはCOMPOSE_R_CUEに対する親の構成要素として、最も近いNPHまたはNPH_Pの語幹を取得する。また、そのCOMPOSE_K_CUEまたはCOMPOSE_R_CUEに係るNPT_Pの語幹を、子の構成要素として取得する。このようにして、親子関係を取得することができる。
The parent-child
また、COMPOSE_K_CUEまたはCOMPOSE_R_CUEよりも前に、NPHまたはNPH_Pが存在しない場合には、親子関係取得部21は、そのCOMPOSE_K_CUEまたはCOMPOSE_R_CUEに対する親の構成要素として、そのCOMPOSE_K_CUEまたはCOMPOSE_R_CUEの係り先の記述断片(他の記述断片を介した係り先の記述断片であってもよい)のうち、最も近いHPを含む記述断片(すなわち、そのHPを含むJEPSON_CUEの記述断片)またはBPの語幹を取得する。また、親子関係取得部21は、そのCOMPOSE_K_CUEまたはCOMPOSE_R_CUEに係るNPT_Pの語幹を、子の構成要素として取得する。このようにして、親子関係を取得することができる。
Further, when NPH or NPH_P does not exist before COMPOSE_K_CUE or COMPOSE_R_CUE, the parent-child
前述の請求項構造情報の場合には、親子関係取得部21は、例えば、記述断片「8 を備え、 COMPOSE_R_CUE 13」に対して、親の構成要素「画像形成装置」と、子の構成要素「ダクト」、「送風手段」、「清浄化手段」とを取得することができる。また、親子関係取得部21は、例えば、記述断片「11 を有し、 COMPOSE_R_CUE 9」に対して、親の構成要素「ダクト」と、子の構成要素「内部ダクト」とを取得することができる。したがって、その取得した親子関係を示す情報は、図12で示されるようになる。
In the case of the above-described claim structure information, the parent-child
階層レベル取得部22は、図12で示される親子関係から、例えば、前述の方法によって、各構成要素の階層レベルを次のように取得する。
構成要素 階層レベル
画像形成装置 1
ダクト 2
送風手段 2
清浄化手段 2
内部ダクト 3
The hierarchical
Component Hierarchy level
Blowing means 2
Cleaning means 2
出力部20は、その構成要素と階層レベルとの対応を用いて、記述断片を表示する際に、その記述断片の語幹が、いずれかの構成要素と一致する場合には、その構成要素に対応する階層レベルの数値を記述断片の位置に表示する。その結果、図13の表示がなされることになる。このようにして、各構成要素の階層レベルをも表示することができ、それを見たユーザは、構成要素の階層レベルを容易に把握することができるようになる。なお、この例では、階層のレベルが深いほど数値が大きくなる階層レベルとしたが、逆であってもよい。すなわち、階層のレベルが深いほど数値が小さくなる階層レベルを採用してもよい。
When displaying the description fragment using the correspondence between the component and the hierarchy level, the
また、本実施の形態において、構成要素を含む記述断片(例えば、BP、NPT_P、NPH、NPH_P等の付与された記述断片)を表示する際には、その記述断片の語幹のみを表示するようにしてもよい。例えば、記述断片「画像形成装置。」に代えて、その語幹「画像形成装置」を表示してもよく、記述断片「前記ダクトは」に代えて、その語幹「ダクト」を表示してもよい。 In this embodiment, when displaying a description fragment including a constituent element (for example, a description fragment to which BP, NPT_P, NPH, NPH_P, etc.) is displayed, only the word stem of the description fragment is displayed. May be. For example, the stem “image forming apparatus” may be displayed instead of the description fragment “image forming apparatus”, and the stem “duct” may be displayed instead of the description fragment “the duct”. .
また、本実施の形態では、区切文節タイプの削除等のように、文節タイプの変更を行う場合について説明したが、そうでなくてもよい。文節タイプの変更を行わない場合には、請求項構造情報生成装置1は、区切文節タイプ変更部18を備えていなくてもよい。なお、文節タイプの変更を行わない場合であっても、あらかじめ規定されている特許請求項の構造を示す規則(例えば、文脈自由文法で記述された規則や、トークンや区切文節タイプの付与された記述断片の係り受け関係等)を適切なものにすることによって、文節タイプの変更を行った場合と同様の結果を得ることも可能である。
Further, in the present embodiment, a case has been described in which the phrase type is changed, such as deletion of the delimited phrase type, but this need not be the case. When the phrase type is not changed, the claim structure
また、上記実施の形態において用いた具体的なルールや条件、情報等は、それらに限定されないことは言うまでもない。目的を実現できる範囲において、適宜、それらを変更してもよい。
また、上記実施の形態では、請求項構造情報生成装置1がスタンドアロンである場合について説明したが、請求項構造情報生成装置1は、スタンドアロンの装置であってもよく、サーバ・クライアントシステムにおけるサーバ装置であってもよい。後者の場合には、出力部は、通信回線を介して情報を出力してもよい。
Needless to say, the specific rules, conditions, information, and the like used in the above embodiments are not limited thereto. As long as the object can be realized, they may be appropriately changed.
Further, in the above embodiment, the case where the claim structure
また、上記実施の形態において、各処理または各機能は、単一の装置または単一のシステムによって集中処理されることによって実現されてもよく、あるいは、複数の装置または複数のシステムによって分散処理されることによって実現されてもよい。 In the above embodiment, each process or each function may be realized by centralized processing by a single device or a single system, or may be distributedly processed by a plurality of devices or a plurality of systems. It may be realized by doing.
また、上記実施の形態において、各構成要素が実行する処理に関係する情報、例えば、各構成要素が受け付けたり、取得したり、選択したり、生成したり、送信したり、受信したりした情報や、各構成要素が処理で用いるしきい値や数式、アドレス等の情報等は、上記説明で明記していない場合であっても、図示しない記録媒体において、一時的に、あるいは長期にわたって保持されていてもよい。また、その図示しない記録媒体への情報の蓄積を、各構成要素、あるいは、図示しない蓄積部が行ってもよい。また、その図示しない記録媒体からの情報の読み出しを、各構成要素、あるいは、図示しない読み出し部が行ってもよい。 In the above embodiment, information related to processing executed by each component, for example, information received, acquired, selected, generated, transmitted, or received by each component In addition, information such as threshold values, mathematical formulas, addresses, etc. used by each component in processing is retained temporarily or over a long period of time on a recording medium (not shown) even when not explicitly stated in the above description. It may be. Further, the storage of information in the recording medium (not shown) may be performed by each component or a storage unit (not shown). Further, reading of information from the recording medium (not shown) may be performed by each component or a reading unit (not shown).
また、上記実施の形態において、各構成要素等で用いられる情報、例えば、各構成要素が処理で用いるしきい値やアドレス、各種の設定値等の情報がユーザによって変更されてもよい場合には、上記説明で明記していない場合であっても、ユーザが適宜、それらの情報を変更できるようにしてもよく、あるいは、そうでなくてもよい。それらの情報をユーザが変更可能な場合には、その変更は、例えば、ユーザからの変更指示を受け付ける図示しない受付部と、その変更指示に応じて情報を変更する図示しない変更部とによって実現されてもよい。その図示しない受付部による変更指示の受け付けは、例えば、入力デバイスからの受け付けでもよく、通信回線を介して送信された情報の受信でもよく、所定の記録媒体から読み出された情報の受け付けでもよい。 In the above embodiment, when information used by each component, for example, information such as a threshold value, an address, and various setting values used by each component may be changed by the user Even if it is not specified in the above description, the user may be able to change the information as appropriate, or it may not be. If the information can be changed by the user, the change is realized by, for example, a not-shown receiving unit that receives a change instruction from the user and a changing unit (not shown) that changes the information in accordance with the change instruction. May be. The change instruction received by the receiving unit (not shown) may be received from an input device, information received via a communication line, or information read from a predetermined recording medium, for example. .
また、上記実施の形態において、請求項構造情報生成装置1に含まれる2以上の構成要素が通信デバイスや入力デバイス等を有する場合に、2以上の構成要素が物理的に単一のデバイスを有してもよく、あるいは、別々のデバイスを有してもよい。
In the above embodiment, when two or more constituent elements included in the claim structure
また、上記実施の形態において、各構成要素は専用のハードウェアにより構成されてもよく、あるいは、ソフトウェアにより実現可能な構成要素については、プログラムを実行することによって実現されてもよい。例えば、ハードディスクや半導体メモリ等の記録媒体に記録されたソフトウェア・プログラムをCPU等のプログラム実行部が読み出して実行することによって、各構成要素が実現され得る。なお、上記実施の形態における請求項構造情報生成装置1を実現するソフトウェアは、以下のようなプログラムである。つまり、このプログラムは、コンピュータを、特許請求項のテキストが区切られた記述断片と当該記述断片の構造とを示す請求項構造情報を生成する請求項構造情報生成装置として機能させるためのプログラムであって、特許請求項のテキストである特許請求項情報が記憶される記憶部で記憶されている特許請求項情報を形態素解析する形態素解析部、特許請求項情報の文節の区切位置を特定する文節特定部、特許請求項情報において、記述断片の区切となると共に記述断片間の関係を示す表層の手がかり情報と、表層の手がかり情報に対応するトークンとを有する表層区切情報が2以上記憶される表層区切情報記憶部で記憶されている表層の手かがり情報に該当する位置に、表層の手がかり情報に対応するトークンを付与するトークン付与部、特許請求項情報において、記述断片の区切となる文節の品詞の手がかり情報と、品詞の手がかり情報に対応する区切文節タイプとを有する文節タイプ対応情報が2以上記憶される文節タイプ対応情報記憶部で記憶されている品詞の手がかり情報に該当する文節に、品詞の手がかり情報に対応する区切文節タイプを付与する区切文節タイプ付与部、特許請求項情報に付与されたトークンと区切文節タイプとを用い、あらかじめ規定されている特許請求項の構造を示す規則に応じて、特許請求項情報の記述断片の構造を示す請求項構造情報を生成する生成部、生成部が生成した請求項構造情報を出力する出力部として機能させるためのものである。
In the above embodiment, each component may be configured by dedicated hardware, or a component that can be realized by software may be realized by executing a program. For example, each component can be realized by a program execution unit such as a CPU reading and executing a software program recorded on a recording medium such as a hard disk or a semiconductor memory. In addition, the software which implement | achieves the claim structure
なお、上記プログラムにおいて、上記プログラムが実現する機能には、ハードウェアでしか実現できない機能は含まれない。例えば、情報を出力する出力部などにおけるモデムやインターフェースカードなどのハードウェアでしか実現できない機能は、上記プログラムが実現する機能には少なくとも含まれない。 In the program, the functions realized by the program do not include functions that can be realized only by hardware. For example, a function that can be realized only by hardware such as a modem or an interface card in an output unit that outputs information is not included in at least the function realized by the program.
また、このプログラムは、サーバなどからダウンロードされることによって実行されてもよく、所定の記録媒体(例えば、CD−ROMなどの光ディスクや磁気ディスク、半導体メモリなど)に記録されたプログラムが読み出されることによって実行されてもよい。また、このプログラムは、プログラムプロダクトを構成するプログラムとして用いられてもよい。 Further, this program may be executed by being downloaded from a server or the like, and a program recorded on a predetermined recording medium (for example, an optical disk such as a CD-ROM, a magnetic disk, a semiconductor memory, or the like) is read out. May be executed by Further, this program may be used as a program constituting a program product.
また、このプログラムを実行するコンピュータは、単数であってもよく、複数であってもよい。すなわち、集中処理を行ってもよく、あるいは分散処理を行ってもよい。 Further, the computer that executes this program may be singular or plural. That is, centralized processing may be performed, or distributed processing may be performed.
図14は、上記プログラムを実行して、上記実施の形態による請求項構造情報生成装置1を実現するコンピュータの外観の一例を示す模式図である。上記実施の形態は、コンピュータハードウェア及びその上で実行されるコンピュータプログラムによって実現されうる。
FIG. 14 is a schematic diagram showing an example of an external appearance of a computer that executes the program and realizes the claim structure
図14において、コンピュータシステム900は、CD−ROM(Compact Disk Read Only Memory)ドライブ905、FD(Floppy(登録商標) Disk)ドライブ906を含むコンピュータ901と、キーボード902と、マウス903と、モニタ904とを備える。
14, a
図15は、コンピュータシステム900の内部構成を示す図である。図15において、コンピュータ901は、CD−ROMドライブ905、FDドライブ906に加えて、MPU(Micro Processing Unit)911と、ブートアッププログラム等のプログラムを記憶するためのROM912と、MPU911に接続され、アプリケーションプログラムの命令を一時的に記憶すると共に、一時記憶空間を提供するRAM(Random Access Memory)913と、アプリケーションプログラム、システムプログラム、及びデータを記憶するハードディスク914と、MPU911、ROM912等を相互に接続するバス915とを備える。なお、コンピュータ901は、LANへの接続を提供する図示しないネットワークカードを含んでいてもよい。
FIG. 15 is a diagram showing an internal configuration of the
コンピュータシステム900に、上記実施の形態による請求項構造情報生成装置1の機能を実行させるプログラムは、CD−ROM921、またはFD922に記憶されて、CD−ROMドライブ905、またはFDドライブ906に挿入され、ハードディスク914に転送されてもよい。これに代えて、そのプログラムは、図示しないネットワークを介してコンピュータ901に送信され、ハードディスク914に記憶されてもよい。プログラムは実行の際にRAM913にロードされる。なお、プログラムは、CD−ROM921やFD922、またはネットワークから直接、ロードされてもよい。
A program for causing the
プログラムは、コンピュータ901に、上記実施の形態による請求項構造情報生成装置1の機能を実行させるオペレーティングシステム(OS)、またはサードパーティプログラム等を必ずしも含んでいなくてもよい。プログラムは、制御された態様で適切な機能(モジュール)を呼び出し、所望の結果が得られるようにする命令の部分のみを含んでいてもよい。コンピュータシステム900がどのように動作するのかについては周知であり、詳細な説明は省略する。
The program does not necessarily include an operating system (OS), a third party program, or the like that causes the
また、本発明は、以上の実施の形態に限定されることなく、種々の変更が可能であり、それらも本発明の範囲内に包含されるものであることは言うまでもない。 Further, the present invention is not limited to the above-described embodiment, and various modifications are possible, and it goes without saying that these are also included in the scope of the present invention.
以上より、本発明による請求項構造情報生成装置等によれば、より深い構造を持つ特許請求項についても、構造解析を行うことができるという効果が得られ、特許請求項を解析する装置等として有用である。 As described above, according to the claim structure information generating apparatus and the like according to the present invention, an effect that a structure analysis can be performed on a claim having a deeper structure can be obtained. Useful.
1 請求項構造情報生成装置
11 記憶部
12 形態素解析部
13 文節特定部
14 表層区切情報記憶部
15 トークン付与部
16 文節タイプ対応情報記憶部
17 区切文節タイプ付与部
18 区切文節タイプ変更部
19 生成部
20 出力部
21 親子関係取得部
22 階層レベル取得部
DESCRIPTION OF
Claims (10)
特許請求項のテキストである特許請求項情報が記憶される記憶部と、
前記特許請求項情報を形態素解析する形態素解析部と、
前記特許請求項情報の文節の区切位置を特定する文節特定部と、
記述断片の区切となると共に記述断片間の関係を示す表層の手がかり情報と、当該表層の手がかり情報に対応するトークンとを有する表層区切情報が2以上記憶される表層区切情報記憶部と、
前記特許請求項情報において、表層の手かがり情報に該当する位置に、当該表層の手がかり情報に対応するトークンを付与するトークン付与部と、
記述断片の区切となる文節の品詞の手がかり情報と、当該品詞の手がかり情報に対応する区切文節タイプとを有する文節タイプ対応情報が2以上記憶される文節タイプ対応情報記憶部と、
前記特許請求項情報において、品詞の手がかり情報に該当する文節に、当該品詞の手がかり情報に対応する区切文節タイプを付与する区切文節タイプ付与部と、
前記特許請求項情報に付与されたトークンと区切文節タイプとを用い、あらかじめ規定されている特許請求項の構造を示す規則に応じて、前記特許請求項情報の記述断片の構造を示す請求項構造情報を生成する生成部と、
前記生成部が生成した請求項構造情報を出力する出力部と、を備え、
前記生成部は、
文脈自由文法で記述されたトークン及び区切文節タイプに関する規則と、当該規則に対応する構造を前記特許請求項情報に付与するアクションとを有する文法ファイルを用いて生成された構文解析器を用いて、前記特許請求項情報に対応する請求項構造情報を生成する、請求項構造情報生成装置。 A claim structure information generating device for generating claim structure information indicating a description fragment in which a text of a claim is delimited and a structure of the description fragment,
A storage unit for storing claim information which is a text of a claim;
A morpheme analysis unit for morphological analysis of the claim information;
A phrase specifying unit for specifying a section position of the clause of the claim information;
A surface layer delimiter information storage unit for storing two or more surface layer delimiter information including delimiters of description fragments and surface layer clue information indicating a relationship between the description fragments, and a token corresponding to the surface layer clue information;
In the claim information, a token granting unit for granting a token corresponding to the surface clue information at a position corresponding to the surface clue information,
A phrase type correspondence information storage unit for storing two or more phrase type correspondence information having clue information on the part of speech of a clause that is a delimiter of a description fragment and a segment clause type corresponding to the clue information on the part of speech;
In the claim information, a delimiter clause type giving unit that gives a delimiter clause type corresponding to the clue information of the part of speech to a clause corresponding to the clue information of the part of speech,
A claim structure indicating a structure of a description fragment of the claim information according to a rule indicating a structure of the claim, which is defined in advance, using a token and a delimiter clause type given to the claim information. A generator for generating information;
An output unit that outputs claim structure information generated by the generation unit , and
The generator is
Using a parser generated using a grammar file having rules relating to tokens and delimited clause types described in a context-free grammar and an action for assigning a structure corresponding to the rules to the claim information, A claim structure information generation device that generates claim structure information corresponding to the claim information.
前記生成部は、前記区切文節タイプ変更部が区切文節タイプを削除した後に請求項構造情報を生成し、
前記区切文節タイプ変更部は、
並列する記述断片の終端の区切文節タイプである終端区切文節タイプと、当該終端区切文節タイプより以前の、並列する記述断片が継続しうる区切文節タイプである継続区切文節タイプとの間に終端区切文節タイプが存在する場合に、両区切文節タイプの間に存在する当該終端区切文節タイプを削除する、請求項1記載の請求項構造情報生成装置。 A delimiter clause type changing unit that deletes delimiter clause types existing at positions that are not delimiters of the descriptive fragment according to the sequence of descriptive fragments,
The generation unit generates claim structure information after the delimiter clause type change unit deletes the delimiter clause type ,
The delimiter clause type change part is:
Termination delimiter between a delimiter clause type that is the delimiter clause type at the end of parallel description fragments and a continuation delimiter clause type that is a delimiter clause type that can be continued by parallel descriptive fragments before the terminal delimiter clause type The claim structure information generating device according to claim 1, wherein when a clause type exists, the terminal break clause type existing between both break clause types is deleted .
前記生成部は、前記区切文節タイプ変更部が区切文節タイプを削除した後に請求項構造情報を生成し、
前記区切文節タイプ変更部は、
改行が存在する場合であって、改行が後続しない動詞に関する区切文節タイプが存在する場合に、当該区切文節タイプを削除する、請求項1記載の請求項構造情報生成装置。 A delimiter clause type changing unit that deletes delimiter clause types existing at positions that are not delimiters of the descriptive fragment according to the sequence of descriptive fragments,
The generation unit generates claim structure information after the delimiter clause type change unit deletes the delimiter clause type,
The delimiter clause type change part is:
The claim structure information generation device according to claim 1 , wherein when there is a line break and there is a line break type related to a verb not followed by a line break, the line break type is deleted.
前記生成部は、
トークン及び区切文節タイプの付与された前記特許請求項情報を終端から先頭への方向で取り込むことによって請求項構造情報を生成する、請求項1から請求項3のいずれか記載の請求項構造情報生成装置。 A description in the context-free grammar of the structure of the claim is written in the direction from the end to the beginning of the claim,
The generator is
The claim structure information generation according to any one of claims 1 to 3 , wherein the claim structure information is generated by taking in the claim information to which a token and a delimiter clause type are attached in a direction from a terminal to a head. apparatus.
前記特許請求項情報に、前記文法ファイルに含まれる規則に対応した構造を示すマークを付与することによって、マークアップ言語を用いて記述された請求項構造情報を生成する、請求項1から請求項4のいずれか記載の請求項構造情報生成装置。 The generator is
Claim structure information described using a markup language is generated by adding a mark indicating a structure corresponding to a rule included in the grammar file to the claim information. 5. The structure information generating device according to claim 4 .
前記生成部が生成した請求項構造情報を、記述断片間の関係が分かるように表示する、請求項1から請求項5のいずれか記載の請求項構造情報生成装置。 The output unit is
The claim structure information generating apparatus according to any one of claims 1 to 5 , wherein the claim structure information generated by the generation unit is displayed so that a relationship between description fragments can be understood.
区切文節タイプには、
構成要素の包含関係を示すトークンに対して、親の構成要素に応じた区切文節タイプである親区切文節タイプと、
構成要素の包含関係を示すトークンに対して、子の構成要素に応じた区切文節タイプである子区切文節タイプと、が存在し、
前記出力部は、親区切文節タイプに対応する記述断片と、子区切文節タイプに対応する記述断片との親子関係が分かるように両記述断片を表示する、請求項6記載の請求項構造情報生成装置。 Tokens exist according to the inclusion relationship of components,
For delimiter clause types,
For tokens that indicate the inclusion relationship of components, a parent delimiter clause type that is a delimiter clause type according to the parent component,
There is a child delimiter clause type, which is a delimiter clause type corresponding to the child component, for the token indicating the inclusion relationship of the component,
7. The structure information generation according to claim 6 , wherein the output unit displays both description fragments so that a parent-child relationship between a description fragment corresponding to a parent-delimited clause type and a description fragment corresponding to a child-delimited clause type can be understood. apparatus.
前記親子関係取得部が取得した構成要素の親子関係を用いて、構成要素の階層レベルを取得する階層レベル取得部と、を備え、
前記出力部は、前記階層レベル取得部が取得した階層レベルに応じて、親区切文節タイプ及び子区切文節タイプに対応する記述断片を表示する、請求項7記載の請求項構造情報生成装置。 A parent-child relationship acquisition unit for acquiring a parent-child relationship of the constituent elements using the claim information to which a parent-delimited clause type and a child-delimited clause type are attached;
A hierarchy level acquisition unit that acquires the hierarchy level of the component using the parent-child relationship of the component acquired by the parent-child relationship acquisition unit, and
8. The structure information generating apparatus according to claim 7 , wherein the output unit displays a description fragment corresponding to a parent delimiter clause type and a child delimiter clause type according to the hierarchy level acquired by the hierarchy level acquisition unit.
前記形態素解析部が、前記特許請求項情報を形態素解析する形態素解析ステップと、
前記文節特定部が、前記特許請求項情報の文節の区切位置を特定する文節特定ステップと、
前記トークン付与部が、前記特許請求項情報において、表層の手かがり情報に該当する位置に、当該表層の手がかり情報に対応するトークンを付与するトークン付与ステップと、
前記区切文節タイプ付与部が、前記特許請求項情報において、品詞の手がかり情報に該当する文節に、当該品詞の手がかり情報に対応する区切文節タイプを付与する区切文節タイプ付与ステップと、
前記生成部が、前記特許請求項情報に付与されたトークンと区切文節タイプとを用い、あらかじめ規定されている特許請求項の構造を示す規則に応じて、前記特許請求項情報の記述断片の構造を示す請求項構造情報を生成する生成ステップと、
前記出力部が、前記生成ステップで生成した請求項構造情報を出力する出力ステップと、を備え、
前記生成ステップでは、
文脈自由文法で記述されたトークン及び区切文節タイプに関する規則と、当該規則に対応する構造を前記特許請求項情報に付与するアクションとを有する文法ファイルを用いて生成された構文解析器を用いて、前記特許請求項情報に対応する請求項構造情報を生成する、請求項構造情報生成方法。 A storage unit for storing claim information, which is a text of a claim, a morpheme analysis unit, a phrase specifying unit, and a surface layer indicating a relationship between the description fragments in the claim text Clue information and a part-of-speech clue information of a clause serving as a delimiter for a description fragment, a surface layer delimiter information storage unit storing two or more surface layer delimiter information having tokens corresponding to the surface layer clue information And a phrase type correspondence information storage unit that stores two or more phrase type correspondence information having a segmentation phrase type corresponding to the clue information of the part of speech, a segmentation phrase type giving unit, a generation unit, and an output unit Claim structure information generating method for generating claim structure information indicating a description fragment and a structure of the description fragment, which are processed by
The morpheme analysis unit performs a morpheme analysis step for morphological analysis of the claim information;
The phrase specifying unit for specifying the position where the clause of the claim information is separated;
In the claim information, the token granting unit grants a token corresponding to the surface clue information at a position corresponding to the surface clue information; and
In the claim information, the demarcation phrase type giving unit assigns a demarcation phrase type corresponding to the part-of-speech clue information to a phrase corresponding to the part-of-speech clue information; and
Structure of description fragment of claim information according to a rule indicating a structure of claim according to a predetermined rule, wherein the generation unit uses a token and a delimiter clause type given to the claim information. Generating a claim structure information indicating:
An output step for outputting the claim structure information generated in the generation step ;
In the generating step,
Using a parser generated using a grammar file having rules relating to tokens and delimited clause types described in a context-free grammar and an action for assigning a structure corresponding to the rules to the claim information, A claim structure information generation method for generating claim structure information corresponding to the claim information.
特許請求項のテキストが区切られた記述断片と当該記述断片の構造とを示す請求項構造情報を生成する請求項構造情報生成装置として機能させるためのプログラムであって、
特許請求項のテキストである特許請求項情報が記憶される記憶部で記憶されている特許請求項情報を形態素解析する形態素解析部、
前記特許請求項情報の文節の区切位置を特定する文節特定部、
前記特許請求項情報において、記述断片の区切となると共に記述断片間の関係を示す表層の手がかり情報と、当該表層の手がかり情報に対応するトークンとを有する表層区切情報が2以上記憶される表層区切情報記憶部で記憶されている表層の手かがり情報に該当する位置に、当該表層の手がかり情報に対応するトークンを付与するトークン付与部、
前記特許請求項情報において、記述断片の区切となる文節の品詞の手がかり情報と、当該品詞の手がかり情報に対応する区切文節タイプとを有する文節タイプ対応情報が2以上記憶される文節タイプ対応情報記憶部で記憶されている品詞の手がかり情報に該当する文節に、当該品詞の手がかり情報に対応する区切文節タイプを付与する区切文節タイプ付与部、
前記特許請求項情報に付与されたトークンと区切文節タイプとを用い、あらかじめ規定されている特許請求項の構造を示す規則に応じて、前記特許請求項情報の記述断片の構造を示す請求項構造情報を生成する生成部、
前記生成部が生成した請求項構造情報を出力する出力部として機能させ、
前記生成部は、
文脈自由文法で記述されたトークン及び区切文節タイプに関する規則と、当該規則に対応する構造を前記特許請求項情報に付与するアクションとを有する文法ファイルを用いて生成された構文解析器を用いて、前記特許請求項情報に対応する請求項構造情報を生成する、プログラム。 Computer
A program for functioning as a claim structure information generation device for generating claim structure information indicating a description fragment in which a text of a claim is delimited and a structure of the description fragment,
A morpheme analysis unit that performs morphological analysis on claim information stored in a storage unit that stores claim information that is a text of a claim,
A phrase specifying unit for specifying a section position of the clause of the claim information;
In the claim information, a surface layer delimiter in which two or more surface layer delimiter information including a surface layer clue information indicating a relationship between the description fragments and a token corresponding to the surface layer clue information is stored. A token grant unit that grants a token corresponding to the surface clue information at a position corresponding to the surface clue information stored in the information storage unit;
In the claim information, the phrase type correspondence information storage in which two or more phrase type correspondence information having clue information on the part of speech of the clause serving as a delimiter of the description fragment and a break phrase type corresponding to the clue information on the part of speech are stored. A delimiter-phrase type assigning unit that adds a delimiter-phrase type corresponding to the clue information of the part of speech to the clause corresponding to the clue information of the part of speech stored in the part,
A claim structure indicating a structure of a description fragment of the claim information according to a rule indicating a structure of the claim, which is defined in advance, using a token and a delimiter clause type given to the claim information. A generator for generating information,
Function as an output unit that outputs claim structure information generated by the generation unit ;
The generator is
Using a parser generated using a grammar file having rules relating to tokens and delimited clause types described in a context-free grammar and an action for assigning a structure corresponding to the rules to the claim information, A program for generating claim structure information corresponding to the claim information .
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2010137876A JP5489872B2 (en) | 2010-06-17 | 2010-06-17 | Claim structure information generation apparatus, claim structure information generation method, and program |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2010137876A JP5489872B2 (en) | 2010-06-17 | 2010-06-17 | Claim structure information generation apparatus, claim structure information generation method, and program |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2012003517A JP2012003517A (en) | 2012-01-05 |
| JP5489872B2 true JP5489872B2 (en) | 2014-05-14 |
Family
ID=45535421
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2010137876A Expired - Fee Related JP5489872B2 (en) | 2010-06-17 | 2010-06-17 | Claim structure information generation apparatus, claim structure information generation method, and program |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP5489872B2 (en) |
Families Citing this family (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP6114090B2 (en) * | 2013-03-29 | 2017-04-12 | 株式会社エヌ・ティ・ティ・データ | Machine translation apparatus, machine translation method and program |
| JP6647713B2 (en) | 2016-06-03 | 2020-02-14 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | Extract keywords in claims |
| KR102181677B1 (en) * | 2018-12-18 | 2020-11-24 | (주)아이브릭스 | Method and apparatus for structuring patent claims |
| US12147770B2 (en) | 2019-12-20 | 2024-11-19 | Resonac Corporation | Information processing device, reading comprehension support method, and program |
Family Cites Families (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP4289871B2 (en) * | 2002-11-11 | 2009-07-01 | 株式会社インテックシステム研究所 | Rhetorical structure analysis method for patent claims, rhetorical structure analysis program for patent claims, and rhetorical structure analysis system for claims |
| WO2009041661A1 (en) * | 2007-09-28 | 2009-04-02 | Intellectual Property Bank Corp. | Information processing apparatus, and program |
-
2010
- 2010-06-17 JP JP2010137876A patent/JP5489872B2/en not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JP2012003517A (en) | 2012-01-05 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US6023760A (en) | Modifying an input string partitioned in accordance with directionality and length constraints | |
| CN102479252B (en) | Query expression conversion apparatus and query expression conversion method | |
| JP2007323671A (en) | Word segmentation in chinese text | |
| JP2002259429A (en) | Computer-based matching text search system and method | |
| JP2007287134A (en) | Information extraction apparatus and information extraction method | |
| JP5100770B2 (en) | Word classification method in kanji sentences | |
| JP5489872B2 (en) | Claim structure information generation apparatus, claim structure information generation method, and program | |
| JP5291351B2 (en) | Evaluation expression extraction method, evaluation expression extraction device, and evaluation expression extraction program | |
| JP4900158B2 (en) | Search system, method and program | |
| JP2019121164A (en) | Document creating apparatus, document creating method, database construction apparatus, database construction method, and program | |
| JP5447368B2 (en) | NEW CASE GENERATION DEVICE, NEW CASE GENERATION METHOD, AND NEW CASE GENERATION PROGRAM | |
| JP3908261B2 (en) | Rhetorical structure analysis system | |
| JP4646328B2 (en) | Related information extraction apparatus and method | |
| JP5430238B2 (en) | Information processing apparatus, information processing method, and program | |
| JP5621145B2 (en) | Document check device, document check program, and document check method | |
| US12333245B2 (en) | Methods and apparatus to improve disambiguation and interpretation in automated text analysis using structured language space and transducers applied on automatons | |
| JPH07210556A (en) | Natural language processing device and natural language processing method | |
| CN103324653A (en) | Main point extraction device and main point extraction method | |
| JP6114090B2 (en) | Machine translation apparatus, machine translation method and program | |
| JPH0877196A (en) | Document information extraction device | |
| JP4155970B2 (en) | Information processing apparatus, synonym database generation method, and synonym database generation program | |
| JP2007219620A (en) | Text retrieval device, program, and method | |
| JP2019028659A (en) | Data processing apparatus, data processing method, and data processing program | |
| JP5142395B2 (en) | Related information extraction apparatus, method, program, and recording medium | |
| Neme | An arabic language resource for computational morphology based on the semitic model |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130121 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20131118 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131120 |
|
| A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131227 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140212 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140225 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 5489872 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| LAPS | Cancellation because of no payment of annual fees |