Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP4191805B2 - Character string conversion apparatus and method having proofreading support function - Google Patents
[go: Go Back, main page]

JP4191805B2 - Character string conversion apparatus and method having proofreading support function - Google Patents

Character string conversion apparatus and method having proofreading support function Download PDF

Info

Publication number
JP4191805B2
JP4191805B2 JP32516095A JP32516095A JP4191805B2 JP 4191805 B2 JP4191805 B2 JP 4191805B2 JP 32516095 A JP32516095 A JP 32516095A JP 32516095 A JP32516095 A JP 32516095A JP 4191805 B2 JP4191805 B2 JP 4191805B2
Authority
JP
Japan
Prior art keywords
character string
phrase
conversion
candidate
command
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP32516095A
Other languages
Japanese (ja)
Other versions
JPH09146953A (en
Inventor
博喜 阿望
健 井上
Original Assignee
株式会社ジャストシステム
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社ジャストシステム filed Critical 株式会社ジャストシステム
Priority to JP32516095A priority Critical patent/JP4191805B2/en
Publication of JPH09146953A publication Critical patent/JPH09146953A/en
Application granted granted Critical
Publication of JP4191805B2 publication Critical patent/JP4191805B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

【0001】
【発明の属する技術分野】
この発明は文字列変換に関し、特にその変換文字列に対する校正の支援を行う技術に関するものである。
【0002】
【従来の技術およびその課題】
与えられたかな文字列を、漢字を含む文字列に変換するシステムが実用化されている。このシステムは、日本語ワードプロセッサ等において、かな文字を入力して漢字まじり文に変換するためのシステム(かな漢字変換システム)として用いられている。
【0003】
このようなかな漢字変換システムにおいて、変換後の漢字まじり文が日本語として適切であるか否かは、使用するユーザが判断していた。つまり、かな漢字変換システムを使用しての文章入力中に適否を判断するか、あるいは、文章を印刷した後に適否を判断するかの何れかを行っていた。
【0004】
しかしながら、上記のような校正作業は必ずしも容易でなく、また、ユーザによっては十分な校正を行うことができない場合もあった。
【0005】
この発明は、上記のような従来の問題点を解決して、校正を容易に行うことのできる文字列変換装置および方法を提供することを目的とする。
【0006】
【課題を解決するための手段】
この発明の文字列変換装置は、
かな文字列に対応付けて変換文字列およびその品詞を記憶した辞書と、
前記辞書を参照して、与えられたかな文字列を、文節に区切って変換文字列に変換した変換文字列候補を出力するとともに、確定指令を受けて、選択された変換文字列候補を確定文字列として出力する変換手段と、
変換文字列候補における各文節の品詞に基づいて、校正支援のための出力を行う校正支援手段と、
を備えている。
【0007】
この発明の文字列変換装置は、校正支援手段が、変換文字列候補における各文節中の付属語が助詞であるか否かを判定し、同じ助詞を有する文節が所定回数以上連続した場合、助詞が連続している旨の校正支援出力を行うものであることを特徴としている。
【0008】
この発明の文字列変換装置は、校正支援手段が、変換文字列候補において、各文節が連体修飾的用法になっているか否かを判断し、連体修飾的用法の文節が所定回数以上連続した場合、修飾語が連続している旨の校正支援出力を行うものであることを特徴としている。
【0009】
この発明の文字列変換装置は、校正支援手段が、a)連体詞、b)用言の連体形、c)名詞相当語と助詞相当語の組合せの何れかによって構成された文節を見い出すと、この文節によって連体修飾適用法が1回連続したと判断し、この文節の後に、a)連体詞、b)用言の連体形、c)名詞相当語と助詞相当語の組合せ、d)名詞と助詞「の」の組合せの何れかによって構成された文節が、何回続くかに基づいて、連体修飾的用法の文節の連続を判断するものであることを特徴としている。
【0010】
この発明の文字列変換装置は、校正支援手段が、変換文字列候補における文節の品詞に基づいて、文章が常体であるか敬体であるかを判断し、該判断に基づいて校正支援出力を行うものであることを特徴としている。
【0011】
この発明の文字列変換装置は、校正支援手段が、変換文字列候補の文節が、「です」「ます」または「ございます」またはこれらの他の活用形である場合や、「ください」「なさい」「おっしゃい」を含む場合に、敬体であると判断することを特徴としている。
【0012】
この発明の文字列変換装置は、校正支援手段が、変換文字列候補の文節のうち、句読点や記号の直前の文節が下記の何れかのものである場合に常体であると判断することを特徴としている。
【0013】
a)体言と終助詞「か」の組合せ
b)体言と「の」と終助詞の組合せ
c)文節最後の用言または助動詞が命令形の場合
d)文節最後の用言が、終止形と接続助詞の組合せの場合
e)文節最後の用言が、終止形と終助詞の組合せの場合
f)文節最後の用言が、連体形と接続助詞の組合せの場合
g)文節最後の用言が、終止形と終助詞の組合せの場合
h)文節最後の用言が、連体形と「の」と終助詞の組合せの場合
この発明の文字列変換装置は、予め決定された「常体」か「敬体」かの文体と、校正支援手段の判断した文体とが異なる場合には、文体が異なる旨の出力を行うことを特徴としている。
【0014】
この発明の文字列変換装置は、校正支援手段が、1文の変換文字列候補に対して、各文節の文体が同一でないと判断した場合には、文体が変化した旨の校正支援出力を行うことを特徴としている。
【0015】
この発明の文字列変換装置は、校正支援手段が、文節が助動詞「れる」「られる」を含む場合、受身表現である旨の校正支援出力を行うことを特徴としている。
【0016】
この発明の文字列変換装置は、
かな文字列に対応付けて変換文字列および校正関連情報を記憶した辞書と、
前記辞書を参照して、与えられたかな文字列を、文節に区切って変換文字列に変換した変換文字列候補を出力するとともに、確定指令を受けて、選択された変換文字列候補を確定文字列として出力する変換手段と、
前記変換手段が、各文節に対応付けて辞書より得た校正関連情報に基づいて、校正支援のための出力を行う校正支援手段と、
を備えている。
【0017】
この発明の文字列変換装置は、与えられたかな文字列に対する変換文字列候補を表示画面に表示するとともに、変換文字列候補に対する校正支援情報を併せて表示または音声にて出力することを特徴としている。
【0018】
この発明の文字列変換装置は、校正支援情報を、変換文字列候補の近傍であって、変換文字列候補とは異なる行に表示するようにしたことを特徴としている。
【0019】
この発明の文字列変換装置は、校正支援情報を、前記文字列候補と同じ行に表示するようにしたことを特徴としている。
【0020】
この発明の文字列変換装置は、校正支援情報を、予め定められた前記文字列候補の表示位置にかかわらない所定の位置に表示するようにしたことを特徴としている。
【0021】
この発明の文字列変換装置は、与えられたかな文字列に対する変換文字列候補を表示画面に表示し、変換文字列候補の各文節に対して校正支援情報がある旨の表示を行うとともに、校正支援情報有りの表示がなされた文節にカーソルが移動された場合にのみ、校正支援情報を表示するようにしたことを特徴としている。
【0022】
この発明の文字列変換方法は、かな文字列に対応付けて変換文字列およびその品詞を予め辞書に記憶しておき、前記辞書を参照して、与えられたかな文字列を、文節に区切って変換文字列に変換した変換文字列候補を出力するとともに、確定指令を受けて、選択された変換文字列候補を確定文字列として出力する文字列変換方法において、変換文字列候補における各文節の品詞に基づいて、校正支援のための出力を行うようにしたことを特徴としている。
【0023】
この発明の文字列変換方法は、変換文字列候補における各文節中の付属語が助詞であるか否かを判定し、同じ助詞を有する文節が所定回数以上連続した場合、助詞が連続している旨の校正支援出力を行うものであることを特徴としている。
【0024】
この発明の文字列変換方法は、変換文字列候補において、各文節が連体修飾的用法になっているか否かを判断し、連体修飾的用法の文節が所定回数以上連続した場合、修飾語が連続している旨の校正支援出力を行うものであることを特徴としている。
【0025】
この発明の文字列変換方法は、変換文字列候補における文節の品詞に基づいて、文章が常体であるか敬体であるかを判断し、該判断に基づいて校正支援出力を行うものであることを特徴としている。
【0026】
この発明の文字列変換方法は、変換文字列候補における文節が助動詞「れる」「られる」を含む場合、受身表現である旨の校正支援出力を行うことを特徴としている。
【0027】
この発明の文字列変換方法は、かな文字列に対応付けて変換文字列および校正関連情報を予め辞書に記憶しておき、前記辞書を参照して、かな文字列を、文節に区切って変換文字列に変換した変換文字列候補を出力するとともに、確定指令を受けて、選択された変換文字列候補を確定文字列として出力する文字列変換方法において、各文節に対応付けて辞書より得た校正関連情報に基づいて、校正支援のための出力を行うものであることを特徴としている。
【0028】
この発明の文字列変換方法は、与えられたかな文字列に対する変換文字列候補を表示画面に表示するとともに、変換文字列候補に対する校正支援情報を併せて表示または音声にて出力することを特徴としている。
【0029】
この発明を説明するために用いた用語の概念は、以下のとおりである。
【0030】
「かな文字列」とは、かな文字列のみで構成される文字列だけでなく、アルファベットやカタカナや記号等を有する文字列も含む概念である。
【0031】
「変換文字列」とは、漢字、かな、カタカナ、アルファベット、記号等の単独または組合せによる文字列をいう。
【0032】
「変換文字列候補」とは、変換文字列の候補をいう。全部が未確定の状態のものだけでなく、一部に確定部分があるものも含む概念である。
【0033】
「一文」とは、句点等にて終了する1つの文を言う。
【0034】
「カーソル」とは、入力領域や制御対象領域を明らかにする画面上の表示をいう。実施形態における、注目文節カーソルCKがこれに該当する。
【0035】
「校正支援情報の出力」とは、校正支援情報を、表示、印刷したり、他のソフトウエア等にデータとして与えることなどをいう。また、音声や振動等によって人間に対して報知することも含む概念である。
【0036】
「記憶媒体」とは、フレキシブル・ディスク、ハードディスク、CD−ROM等の、コンピュータ可読であってプログラムを固定可能な媒体をいう。
【0037】
「コンピュータにより実行可能なプログラム」とは、記憶媒体に記憶されたプログラムが直接実行可能な場合だけでなく、インストールを行うことによって実行可能となるようなプログラムや他のプログラムと組み合わせることによって実行可能となるプログラム等の間接的に実行可能なものも含む。
【0038】
【発明の効果】
この発明の文字列変換装置およびこの発明の文字列変換方法は、変換文字列候補における各文節の品詞に基づいて、校正支援のための出力を行うようにしたことを特徴としている。したがって、文字列変換の操作時に校正支援の情報を与えることができる。
【0039】
この発明の文字列変換装置およびこの発明の文字列変換方法は、同じ助詞を有する文節が所定回数以上連続した場合、助詞が連続している旨の校正支援出力を行うものであることを特徴としている。したがって、文字列変換の操作時に助詞の不適切な連続状態を校正支援情報として与えることができる。
【0040】
この発明の文字列変換装置およびこの発明の文字列変換方法は、変換文字列候補において、連体修飾的用法の文節が所定回数以上連続した場合、修飾語が連続している旨の校正支援出力を行うものであることを特徴としている。したがって、文字列変換の操作時に修飾語の不適切な連続状態を校正支援情報として与えることができる。
【0041】
この発明の文字列変換装置は、校正支援手段が、a)連体詞、b)用言の連体形、c)名詞相当語と助詞相当語の組合せの何れかによって構成された文節を見い出すと、この文節によって連体修飾適用法が1回連続したと判断し、当該文節の後に、a)連体詞、b)用言の連体形、c)名詞相当語と助詞相当語の組合せ、d)名詞と助詞「の」の組合せの何れかによって構成された文節が何回続くかに基づいて、連体修飾的用法の文節の連続を判断するものであることを特徴としている。したがって、より正確に、不適切な修飾語の連続を検出することができる。
【0042】
この発明の文字列変換装置およびこの発明の文字列変換方法は、変換文字列候補における文節の品詞に基づいて、文章が常体であるか敬体であるかを判断し、該判断に基づいて校正支援出力を行うものであることを特徴としている。したがって、文字列変換の操作時にその文体を校正支援情報として与えることができる。
【0043】
この発明の文字列変換装置は、変換文字列候補の文節が、「です」「ます」または「ございます」またはこれらの他の活用形である場合や、「ください」「なさい」「おっしゃい」を含む場合に、敬体であると判断することを特徴としている。したがって、より正確に、敬体を検出することができる。
【0044】
この発明の文字列変換装置は、変換文字列候補の文節のうち、句読点や記号の直前の文節が下記の何れかのものである場合に常体であると判断することを特徴としている。a)体言と終助詞「か」の組合せ、b)体言と「の」と終助詞の組合せ、c)文節最後の用言または助動詞が命令形の場合、d)文節最後の用言が、終止形と接続助詞の組合せの場合、e)文節最後の用言が、終止形と終助詞の組合せの場合、f)文節最後の用言が、連体形と接続助詞の組合せの場合、g)文節最後の用言が、終止形と終助詞の組合せの場合、h)文節最後の用言が、連体形と「の」と終助詞の組合せの場合。したがって、より正確に、常体を検出することができる。
【0045】
この発明の文字列変換装置は、予め決定された「常体」か「敬体」かの文体と、校正支援手段の判断した文体とが異なる場合には、文体が異なる旨の出力を行うことを特徴としている。したがって、文字列変換の処理時に、予定された文体と異なる文体が入力されたことを校正支援情報として与えることができる。
【0046】
この発明の文字列変換装置は、1文の変換文字列候補に対して、各文節の文体が同一でないと判断した場合には、文体が変化した旨の校正支援出力を行うことを特徴としている。したがって、文字列変換の処理時に、文体の変化した文が入力されたことを校正支援情報として与えることができる。
【0047】
この発明の文字列変換装置およびこの発明の文字列変換方法は、変換文字列候補における文節が助動詞「れる」「られる」を含む場合、受身表現である旨の校正支援出力を行うことを特徴としている。したがって、文字列変換の処理時に、受け身表現である旨の情報を校正支援情報として与えることができる。
【0048】
この発明の文字列変換装置およびこの発明の文字列変換方法は、各文節に対応付けて辞書より得た校正関連情報に基づいて、校正支援のための出力を行うものであることを特徴としている。したがって、文字列変換の処理時に、辞書より得た情報に基づいて校正支援情報を与えることができる。
【0049】
この発明の文字列変換装置およびこの発明の文字列変換方法は、変換文字列候補に対する校正支援情報を表示または音声にて出力することを特徴としている。したがって、変換文字列候補の表示に対応して、容易に校正支援情報を得ることができる。
【0050】
この発明の文字列変換装置は、校正支援情報を、変換文字列候補の近傍であって、変換文字列候補とは異なる行に表示するようにしたことを特徴としている。したがって、校正支援情報の視覚的確認が容易である。
【0051】
この発明の文字列変換装置は、校正支援情報を、前記文字列候補と同じ行に表示するようにしたことを特徴としている。したがって、校正支援情報の視覚的確認が容易である。
【0052】
この発明の文字列変換装置は、校正支援情報を、予め定められた前記文字列候補の表示位置にかかわらない所定の位置に表示するようにしたことを特徴としている。したがって、校正支援情報の表示位置が一定され、その確認が容易である。
【0053】
この発明の文字列変換装置は、変換文字列候補の各文節に対して校正支援情報がある旨の表示を行うとともに、校正支援情報有りの表示がなされた文節にカーソルが移動された場合にのみ、校正支援情報を表示するようにしたことを特徴としている。したがって、校正支援情報の有無を容易に確認できるとともに、その内容の表示必要範囲を小さくすることができる。
【0054】
【発明の実施の形態】
図1に、この発明の一実施形態による文字列変換装置の全体構成を示す。この実施形態においては、かな文字列記憶部4、文節候補記憶部6、文節生成手段14、文節候補選定手段16によって変換手段2が構成されている。また、自立語辞書8と付属語辞書10によって辞書12が構成されている。
【0055】
変換手段2に与えられた「かな文字列」は、かな文字列記憶部14に記憶される。文節生成手段14は、辞書12を参照して、かな文字列記憶手段14に記憶された「かな文字列」から、可能な文節を生成する。文節生成手段14は、生成した文節を文節候補記憶部6に記憶する。つまり、各文節の自立語および付属語について辞書から取得した、漢字、品詞、活用形、校正関連情報等を記憶する。文節候補選定手段16は、文節候補記憶部6に記憶された文節を組み合せて可能な文節経路を見い出す。可能な文節経路が複数存在する場合には、所定の選定処理によって、文節経路(変換文字列候補)を1つに絞る。
【0056】
文節候補選定手段16は、この変換文字列候補を表示手段20に送って表示させる。また、変更指令が与えられると、異なる変換文字列候補を表示手段20に表示させる。確定指令が与えられると、変換文字列候補を確定文字列として出力する。
【0057】
校正支援手段18は、文節候補記憶部6に記憶された文節の品詞に基づいて、校正支援情報を生成して表示手段20に出力し表示させる。また、文節候補記憶部6に記憶された文節に関する校正関連情報に基づいて、校正支援情報を生成して表示手段20に出力し表示させる。
【0058】
図1の文字列変換装置を、CPUを用いて実現した場合のハードウエア構成を図2に示す。バスライン34には、CPU22、ハードディスク24、表示手段であるディスプレイ20、メモリ28、フレキシブル・ディスク・コントローラ(FDD)30、キーボード32が接続されている。ハードディスク24には、自立語辞書8、文字列変換処理のプログラム40、校正支援処理のプログラム42等が記憶されている。これらは、FDD30を介して、フレキシブルディスク(FD)36からインストールしたものである。もちろん、CD−ROM等から取り込んだものであってもよい。また、通信回線を介してダウンロードしたものであってもよい。
【0059】
メモリ28には、かな文字列を記憶するためのかな文字列記憶部4や文節候補を記憶するための文節候補記憶部6が設けられている。また、付属語辞書10も設けられている。
【0060】
図3に、自立語辞書8のデータ構造を示す。なお、自立語とは、その語単独で文節となりうる語をいう。自立語辞書8には、変換対象である文字列(読み)に対応する漢字が記憶されている。さらに、これらに対応して、品詞および校正関連情報が記憶されている。なお、「読み」の欄には、かな文字が記憶されるのが一般的であるが、その一部または全部にアルファベットを含んでいてもよい。また、「漢字」の欄には、漢字だけでなく、かなやアルファベットも記憶されていてもよい。
【0061】
図4に、付属語辞書10のデータ構造を示す。付属語とは、その語単独で文節となり得ない語をいう。付属語辞書10には、付属語と、これに対応して、その品詞、活用形が記憶されている。品詞は、助詞、助動詞、用言の活用語尾に分類して記憶されている。助詞は、さらに格助詞、接続助詞、副助詞、終助詞に分類して記憶されている。また、用言の活用語尾については、その活用形(未然形、連用形、終止形・・・命令形)が記憶されている。さらに、各付属語が、どの言葉の後に用いうるかも記憶されている(先行しうる自立語・付属語)。
【0062】
なお、この実施形態おいて用いた、品詞の分類を以下に示す。
【0063】
一般名詞:物や物の状態に付ける一般的な名詞
名詞サ変:後ろにサ変動詞「する」をつけることのできる名詞
名詞ザ変:後ろにザ変動詞「ずる」をつけることのできる名詞
名詞形動:ものごとの姿・状態・性質などを表し、うしろに「だ」「な」を付けることのできる名詞
独立語:動詞や助動詞がつかず、他の言葉とつながりを持たない言葉
連体詞:活用がなく、体言だけを修飾する言葉
接続詞:語句を続けるために使う言葉
感動詞:感動、応答、呼びかけなどを表す言葉
接頭語:他の前に付けて使う言葉
接尾辞:他の言葉の後ろに付けて使う言葉
数詞:数量、順序などを数えて表す言葉
動詞:活用の仕方によりさらに細分類している
形容詞:もごとの性質・状態を表し、言い切るときの形が「い」で終わる言葉
形容動詞:もごとの性質・状態を表し、言い切るときの形が「だ」「な」で終わる言葉
副詞:主に用言を修飾する言葉
【0064】
【変換処理および校正支援処理の概略】
図5に、文字列変換プログラム40と校正支援プログラム42のフローチャートを示す。なお、両プログラムは一体化してもよいし、その一部または全部をモジュール化して分離してもよい。このフローチャートに従って、「わたしはにほんごしょりにかんしんがある」というかな文字列を、変換する処理について説明する。まず、キーボード32から上記のかな文字列が入力されると(ステップS1)、CPU22は、これをメモリ28内のかな文字列記憶部4に記憶する(図6参照)。
【0065】
つぎに、CPU22は、かな文字列記憶部4のかな文字列に付き、先頭のかな文字から順に、自立語辞書8および付属語辞書10を検索して文節を生成する(ステップS2)。つまり、可能な文節を全て生成し、メモリ28内の文節候補記憶部6に記憶する。図6に、このようにして文節候補記憶部6に記憶される文節を、かな文字列に対応付けて示す。図中、α1、α2、α3、α4、β1・・・が生成された文節を示している。文節α1〜α4は、「わ」を先頭とする検索文字列に対応する漢字(および付属語)である。文節α1は検索文字列が1文字であり、文節α2は2文字、文節α3は3文字、文節α4は4文字である。各長さの検索文字列について、1つの文節のみを候補として記憶している。つまり、文節α1においては、「和」以外に多数の漢字が検索されるが、使用頻度や前後の単語との関係等を考慮して、最も優先度の高い漢字「和」を1つだけ選択している。文節α2、α3、α4についても同様である。
【0066】
また、文節β1、β2、β3は、「た」を先頭とする検索文字列に対応する漢字(および付属語)である。同様にして、可能性のある全ての文節が文節候補記憶部6に記憶される。なお、記憶する際には、図7に示すように、辞書より取得した品詞、活用形、校正関連情報(後述する)を併せて記憶する。文節の位置情報、つまり、かな文字列のどの部分に対応するかの情報も記憶するが、図7においては省略している。
【0067】
以上のようにして、文節の生成および文節候補記憶部6への記憶が終了すると、CPU22は、文節経路の候補を選定する(ステップS3)。つまり、かな文字列に対応づけて、組合せ可能な文節を見いだす。たとえば、文節α1の「和」に続けることが可能な文節は、文節β1〜β3だけであり、それ以外の文節は続けることができない。このような検討を最後の文節まで行って、可能な文節の組合せ(文節経路と呼ぶ)を見いだす。複数の文節経路が見いだされた場合には、学習情報や文節間の関連等に基づき、最も優先度の高い文節経路を1つ選定する。このような文節経路の選定により、たとえば「私は/日本語/処理に/感心が/ある/。」という変換文字列候補が選定される(/は文節の区切りを表す)。
【0068】
次に、CPU22は、この変換文字列候補の各文節の品詞に基づいて、校正支援の必要性の有無を判断する(ステップS4)。校正支援の必要があれば、変換文字列候補をディスプレイ20に表示する際に、併せて校正支援情報を表示する(ステップS5)。校正支援の必要がなければ、変換文字列候補のみをディスプレイ20に表示する(ステップS6)。表示例を図8Aに示す。図において、文節「私は」がカーソルCKで囲まれている。これは、現在の処理対象である文節(注目文節と呼ぶ)が「私は」であることを示すものである。なお、校正支援が必要であるか否かの判断処理は、後で詳述する。
【0069】
変換文字列候補を表示した後、ユーザからの指令を待つ(ステップS7)。ユーザは、ディスプレイ20に表示された変換文字列候補を見て、種々の指令をキーボード32(マウス等の場合もある)から入力する
ステップS7において、注目文節の移動指令が入力されると、CPU22は、注目文節を指令された方向に従って移動させ、カーソルCKの表示も併せて移動させる。たとえば、図8Aの状態において、注目文節を右に移動させる指令が与えられると、図8Bに示すように、カーソルCKが右に移動し「日本語」が注目文節となる。さらに、2回右に移動させる指令が与えられると、図8Cに示すように注目文節のカーソルCKが「感心が」に移動する。
【0070】
ステップS7において、他候補の指令が与えられると、注目文節「感心が」の自立語、付属語について、自立語辞書8、付属語辞書10から他の候補を選択してくる(ステップS10)。たとえば、「関心が」を選択する。CPU22は、この際に、図7に示す文節候補記憶手段6の「感心が」の部分を、「関心が」に書き換え、品詞や活用形や校正関連情報等も、新たに辞書から取得したものに書き換える。その後、再び、この新たな変換文字列候補について、校正支援の必要性の有無を判断し(ステップS4)、表示を行う(ステップS5、S6)。つまり、図8Dに示すような表示が行われる。
【0071】
また、ステップS7において、後変換指令が与えられると、注目文節全体を該指令の内容に従って後変換する(ステップS12)。たとえば、カタカナへの後変換指令が与えられると、図8Eに示すように注目文節全体が「カンシンガ」に変更される。これに応じて、図7の文節候補記憶部6の内容も上記と同様にして、書き換えられる。ただし、この言葉は、辞書から取得したものではないので(後変換語と呼ぶ)、品詞の欄に、強制的に一般名詞とされる。
【0072】
また、ステップS7において、文節区切りの変更指令が与えられると、注目文節を長く(または短く)して(ステップS11)、再び、文節候補記憶部6の記憶内容に基づいて文節経路候補を選定する(ステップS3)。つまり、文節区切り位置の異なる新たな変換文字列候補を生成する。以降の処理は、上記で説明した処理と同様であり、再び、校正支援の必要性の有無を判断した後、表示を行う(ステップS4、S5、S6)。
【0073】
以上のような処理を経て、確定指令が入力されると、その時点の変換文字列候補を確定文字列(変換文字列)としてアプリケーション等(ワープロソフトウエア等)に出力する(ステップS8)。この実施形態においては、校正支援情報は、アプリケーション等には出力しない。ただし、アプリケーション側で、校正支援情報が有用な場合もあるので、校正支援情報である旨を明らかにして出力するようにしてもよい。特に、校正支援情報が添付されていることによって、ユーザが表示された校正支援に反してでもそのような表現を用いたかったこと等をアプリケーション側で判断することもできる。
【0074】
ステップS8においては、併せて、確定した文字列であることを明らかにするため、その画面上における表示色を変更する。また、校正支援情報の表示を止める。
【0075】
また、確定指令が与えられて確定文字列を出力した時点で、1つの文が終わっていれば(「。」によって文が終了する)、図7の文節候補記憶部6の内容をクリアする。文の途中で確定指令が出された場合には、文節候補記憶部6の内容はそのまま保持される。つまり、この実施形態では、1つの文の全ての文節が確定されるまで、文節候補記憶部6の内容が保持されるようになっている。
【0076】
【助詞の連続判定の処理】
次に、ステップS4における校正支援の必要性有無の判断処理を説明する。この実施形態では、助詞の連続、修飾語の連続、文体、受け身表現等について、ステップS4での判断を行っている。まず、助詞の連続判定処理について、図9のフローチャートを参照して説明する。
【0077】
ここにいう助詞の連続とは、「私の子の問題の・・・」や「急いで自転車で・・・」のように、助詞「の」や「が」が連続しており不明瞭となる可能性が高い場合をいう。このような場合には、図10Aに示すように{助詞の連続}という校正支援の表示を行って、ユーザにその旨の注意を与えるようにしている。なお、名詞相当語(一般名詞、固有名詞、名詞サ変、数詞、接尾語、助数詞、後変換語)を含む文節であって、その付属語末尾の助詞が、「の」「で」「が」「を」であるものを対象として判断している。
【0078】
まず、ステップS20において、CPU22は、「の」のためのカウンタN、「で」のためのカウンタD、「が」のためのカウンタG、「を」のためのカウンタWOを、メモリ28内に確保して、その内容をクリアする。次に、変換文字列候補の最初の文節(図10Aの「私の」)が、名詞相当語を含んでいるか否かを判断する(ステップS21)。この判断は、文節候補記憶部6(図7参照)の記憶内容を参照することにより行う。たとえば、「私の」であれば、「一般名詞、格助詞」と記憶されているので、名詞相当語を含む文節であると判断される。
【0079】
名詞相当語を含む文節であれば、付属語を含む文節であるか否かを判断する(ステップS22)。前述のように、「私の」に関して、付属語である「格助詞」が文節候補記憶部6に記憶されているので、付属語を含むと判断される。さらに、付属語の末尾が助詞であるか否かが判定される(ステップS23)。ここでは、助詞であると判断される。
【0080】
助詞であると判断されると、当該助詞の種類が検討される(ステップS24)。ここでは、「の」であるから、ステップS25に進んで、カウンタNをインクリメントする。次に、カウンタNが「1」であるか否かを判断する(ステップS26)。「の」の連続の最初であれば、カウンタNは「1」となるので、ステップS27、S28、S29、S30、S33を経て、ステップS21に戻る。つまり、次の文節「子の」について、上記の処理を繰り返す。これにより、助詞「の」が連続した場合に、その回数をカウンタNに記憶することができる。
【0081】
なお、ステップS24において、「で」「が」「を」であった場合のフローチャートは省略している。これらの場合も、「の」と同様の処理を行っている。
【0082】
例えば、図10Aに示すような変換文字列候補の場合には、最後の文節の処理を終えると、Nカウンタの値が「3」となる。その後、ステップS30において、この後に文節がないことを判定すると、ステップS31に進む。ステップS31では、カウンタN、G、D、WOの何れかが所定値以上であるか否かを判断する。この実施形態では、カウンタN、Gについては所定値を「3」、カウンタD、WOについては所定値を「2」としている。つまり、「の」「が」については3回以上の繰り返し、「で」「を」については2回以上の繰り返しにより、校正支援を行うようにしている。ここでは、カウンタNが「3」であって所定値以上であるから、現在の文節に対し助詞が連続している旨のフラグを立てる。つまり、図11Aに示すように、フラグテーブルの文節番号3の欄に対し、助詞の連続の項目を「1」にする。
【0083】
図5のステップS5では、このフラグに基づいて、3番目の文節の後に、{助詞の連続}という校正支援情報を表示する(図10A参照)。
【0084】
図9の助詞の連続判定の処理では、異なる助詞が続いた場合には、カウンタをクリアするようにしている(ステップS29)。したがって、図10Bに示すように、途中に助詞「い」が入る場合には、助詞「の」が全体として3個あっても、{助詞の連続}という校正支援情報は出さない。ただし、図10Cに示すように、付属語を持たない名詞相当語「即時」が間にある場合には、カウンタをクリアせず、カウントを継続する。つまり、ステップS22、S30、S33、S21の処理経路には、カウンタのクリアが設けられていない。
【0085】
また、この実施形態では、図10Dに示すように、所定値を越えた文節の直後に表示するのではなく、当該助詞の連続する文節の最後に校正支援情報を表示するようにしている。
【0086】
なお、図11Aに示すようなフラグテーブルを有しているので、図10Eに示すように、変換文字列候補中の途中の文節においても校正支援情報を表示できる。 また、フローチャートでは省略したが、図10Fに示すように、途中に句読点や記号等があるとカウンタをクリアするようにしている。
【0087】
さらに、ステップS23において、助詞「〜だの」「〜もの」「〜ので」「〜ようで」「〜そうで」が末尾に来ても、ステップS35に分岐するようにしている。これもフローチャートでは省略している。
【0088】
図5の全体フローチャートから明らかなように、候補の変更や文節区切りの変更があった場合には、再度、校正支援の必要性を判断するようにしている(ステップS4)。たとえば、図10Aのような状態において、「子の」を連体詞である「この」に変更すると、図10Gに示すように校正支援情報の表示は消える。同様に、「私の」を、後変換により「ワタシノ」にすれば、品詞が名詞のみとなるので、図10Hに示すように校正支援情報の表示は消える。
【0089】
また、文節候補記憶部6には、1つの文が最後まで確定されるまで品詞情報等を保持されるようにしている。したがって、上記の処理は、未確定の文節に対してだけでなく、すでに確定された文節も含めて行うことができる。たとえば、図10Aにおいて、「私の」「子の」が確定されおり、「問題の」だけが未確定の場合であっても、同じように校正支援情報は表示される。よって、より実用性の高い、校正支援を行うことができる。
【0090】
【修飾語の連続判定】
次に、修飾語の連続判定処理について説明する。ここで、修飾語の連続とは、連体修飾語の文節が3以上連続する場合、たとえば、「白い/大きい/かごの/中の・・・」という文のように、修飾語が連続しており不明瞭となる可能性が高い場合をいう。このような場合には、図13Aに示すように{修飾語の連続}という校正支援の表示を行って、ユーザにその旨の注意を与えるようにしている。
【0091】
図12のフローチャートを参照して、修飾語の連続判定の処理を説明する。まず、ステップS40において、名詞相当語と助詞相当語(〜による、〜における、〜に関するをいう)の順で組合せとなる複数の文節を、変換文字列候補の中から探し出す。このような複数の文節を、1つの連体修飾的用法の文節であるとみなす(ステップS40)。この判断は、文節候補記憶部6の記憶内容に基づいて行うことができる。たとえば、「特許に関する」という文は、「特許に」という一般名詞と格助詞との組合せからなる文節と、「関する」という動詞の語幹と活用語尾との組合せからなる文節によって構成されている。ステップS40では、この2つの文節を、1つの連体修飾的用法の文節であるとみなす。「特許」という名詞相当語と「〜に関する」という助詞相当語の組合せと見ることができるからである。ただし、1つの文節とみなすのは、修飾語の連続判定処理においてのみである。
【0092】
次に、CPU22は、修飾語のためのカウンタRをメモリ28内に確保して、その内容をクリアする(ステップS41)。まず、最初の文節の品詞が、連体詞(あらゆる、たいした、とんだ等)であるか否かを判断する(ステップS42)。この判断も、文節候補記憶部6の「品詞」の欄を参照することによって行うことができる(図7参照)。連体詞であれば、カウンタRをインクリメントする(ステップS49)。そして、次の文節についての解析を行う。
【0093】
連体詞でなければ、文節が用言(動詞、形容詞、形容動詞)の連体形であるか否かを判断する(ステップS43)。用言であるか否かは、文節候補記憶部6の「品詞」の欄、連体形であるか否かは「活用形」の欄を参照して判断することができる。用言の連体形(たとえば、白い、元気な、大きい等)であれば、カウンタRをインクリメントし(ステップS49)、次の文節についての解析を行う。
【0094】
用言の連体形でなければ、文節がステップS40で判断した連体修飾的用法に該当するか否かを判断する(ステップS44)。連体修飾的用法であれば、カウンタRをインクリメントし(ステップS49)、次の文節についての解析を行う。
【0095】
連体修飾的用法でなければ、文節が名詞と格助詞「の」との組合せによって構成されているか否かを判断する(ステップS45)。そうでなければ(つまり、ステップS42〜S45の連体修飾的用法のいずれでもなければ)、カウンタRによって、連体修飾的用法の連続回数を判定する(ステップS46)。カウンタRが「3」以上であれば、現在の文節の直前の文節に対して、修飾語の連続フラグを立てる(図11参照)。
【0096】
また、ステップS52において、最後の文節までくれば、同様に、カウンタRの値が「3」以上か否かを判断する(ステップS54)。3以上であれば、現在の文節に対して、図11の修飾語の連続フラグを立てる。たとえば、図13Aに示すような変換候補文字列であれば、図11Bに示すように、4番目の文節に対してフラグが立てられる。
【0097】
図5のステップS5では、このフラグに基づいて、4番目の文節の後に、{修飾語の連続}という校正支援情報を表示する(図13A参照)。
【0098】
なお、この実施形態においては、名詞と「の」の組合せによる文節によって修飾語の連続は開始しないものとしている。つまり、カウンタRが「0」の場合には、カウンタRをインクリメントしないようにしている(ステップS50)。したがって、図13Bのような変換候補文字列に対しては、校正支援情報は表示されない。ただし、一旦、修飾語の連続が開始すると、名詞と「の」の組合せによる文節の存在により、カウンタRをインクリメントするようにしている(ステップS50、S51)。したがって、図13Aのような変換候補文字列に対しては、校正支援情報が表示される。
【0099】
図12の修飾語の連続判定の処理では、連体修飾的用法の文節でない文節があった場合には、カウンタRをクリアするようにしている(ステップ、S45、S46、S48、S、49、S41)。したがって、図13Cに示すように、途中に文節「中に」があると、連体修飾的用法の文節が全体として3個あっても、{修飾語の連続}という校正支援情報は出さない。ただし、図13Dに示すように、付属語を持たない名詞相当語「竹」が間にある場合には、カウンタRをクリアせず、カウントを継続する。したがって、校正支援情報が表示される。この処理は、図12のフローチャートにおいては省略している。
【0100】
また、この実施形態では、図13Aに示すように、所定値を越えた文節「かごの」の直後に表示するのではなく、連続する連体修飾的用法の文節の最後の文節「中の」の後に校正支援情報を表示するようにしている。
【0101】
なお、図11Bに示すようなフラグテーブルを有しているので、図13Eに示すように、変換文字列候補中の途中の文節においても校正支援情報を表示できる。 また、フローチャートでは省略したが、図13Fに示すように、途中に句読点や記号等があるとカウンタをクリアするようにしている。
【0102】
図5の全体フローチャートから明らかなように、候補の変更や文節区切りの変更があった場合には、再度、校正支援の必要性を判断するようにしている(ステップS4)。この点は、助詞の連続の場合と同じである。
【0103】
また、文節候補記憶部6には、1つの文が最後まで確定されるまで品詞情報等を保持されるようにしている。したがって、上記の処理は、未確定の文節に対してだけでなく、すでに確定された文節も含めて行うことができる。この点も、助詞の連続の場合と同じである。
【0104】
なお、上記実施形態では、ステップS42、S43、S44、S45の何れかに示す条件を満たすものを連体修飾的用法の文節であるとしている。しかし、処理速度と校正支援の要求される度合い等の観点から、何れかを連体修飾的用法でないものとして扱ってもよい。また、その条件を緩和したり、厳しくしたりしてもよい。
【0105】
【文体の判定】
次に、文体の判定処理について説明する。ここで、文体とは、ていねいな表現であるか(敬体、ですます調)、通常の表現(常体、である調)であるかをいうものである。この実施形態では、予め、ユーザに文体を指定させておき、この文体と変換文字列候補の文体が異なる場合に、{である調}や{ですます調}という校正支援の表示を行って、ユーザにその旨の注意を与えるようにしている。
【0106】
図14のフローチャートを参照して、文体の判定処理を説明する。まず、ステップS60において、CPU22は、メモリ28内に、敬体フラグKと常体フラグJを設定し、その内容をクリアする。次に、変換文字列候補の最初の文節について、助動詞「です」「ます」「ございます」のうち何れか(全ての活用形を含む)を含んでいるか否かを判断する(ステップS61)。これは、文節候補記憶部6の記憶内容に基づいて判断することができる。含んでいれば、敬体であると判断し、敬体フラグKを「1」にする(ステップS65)。例えば、図15Aに示すように変換文字列候補が「吾輩は猫である。」であった場合には、その最初の文節「吾輩は」は、上記の助動詞を含んでいない。したがって、ステップS62に進む。
【0107】
ステップS62においては、当該文節が用言の命令形「ください」「なさい」「おっしゃい」(ラ行特別)を含んでいるか否かを判断する。この判断も、文節候補記憶部6の「品詞」「活用形」の欄を参照して行うことができる。これを含んでいれば、敬体であると判断し、敬体フラグKを「1」にする(ステップS65)。図15Aの例では、最初の文節「吾輩は」には、上記の命令形は含まれていないので、ステップS63に進む。
【0108】
ステップS63においては、当該文節が句読点や記号の直前のものか否かを判断する。「吾輩は」は、これに該当しないので、ステップS63、S72を経て、次の文節についてステップS61以下を繰り返す。
【0109】
次の文節「猫である」は、ステップS61、S62の何れにも該当しない。「猫である」は句読点の直前の文節であるから、ステップS63において、ステップS64に分岐する。ステップS64においては、文体が常体であるか否かを判断する。このように、常体か否かの判断は、句読点や記号の直前の文節によって行う。
【0110】
この実施形態では、以下の何れかの条件を満たす場合に、常体であると判断している。
【0111】
a1)文節が用言を含まず、かつ、体言+終助詞「か」である場合:例「問題か?」
a2)文節が用言を含まず、かつ、体言+「の」+終助詞である場合
b1)文節最後の用言または助動詞が命令形の場合:例「考えろ。」
c1)文節最後の用言または助動詞が終止形+接続助詞の場合:例「考えるが、」
c2)文節最後の用言または助動詞が終止形+終助詞の場合
c3)文節最後の用言または助動詞が連体形+接続助詞の場合
c4)文節最後の用言または助動詞が終止形+終助詞の場合
d1)文節最後の用言が連体形+「の」+終助詞の場合:例「考えるのか?」。
【0112】
ここで「猫である」は、上記に該当するので、常体であると判断される。よって、常体フラグJを「1」にする(ステップS71)。
【0113】
次の文節は「。」であり、これによって文が終わるので、ステップS66からS67へ分岐する。ステップS67においては、予め設定していた文体(メモリ28に領域を設けて記憶しておく)と、判定された文体とが異なるか否かを判断する。設定文体が「敬体」であれば、判定文体と異なるので、文体エラー表示フラグを立てる(ステップS68)。
【0114】
図5のステップS5では、このフラグに基づいて、最後の文節の後に、{である調}という校正支援情報を表示する(図15B参照)。
【0115】
なお、上記の場合に、設定文体が「常体」であれば、判定文体と一致しているので、図15Aに示すように、校正支援情報は表示されない。
【0116】
また、設定文体が「常体」であって、変換文字列候補が図15Cのようであれば、{ですます調}という校正支援情報が表示される。
【0117】
さらに、ステップS69において、フラグK、Jがともに「1」であるか否かを判断している。両フラグがともに「1」であるということは、1つの文章中で文体が変化したことを示している。たとえば、図15Dのような変換文字列候補の場合には、両フラグが「1」となる。この場合には、ステップS70において、文体変化表示フラグを立てる。
【0118】
図5のステップS5では、このフラグに基づいて、最後の文節の後に、{文体が変化}という校正支援情報を表示する(図15D参照)。
【0119】
なお、この実施形態では、1つの文に対して文体の変化を判定している。しかし、すでに最後の文節まで確定された以前の文をバッファ等に記憶しておけば、複数文にわたっての文体変化判定が可能である。
【0120】
図5の全体フローチャートから明らかなように、候補の変更や文節区切りの変更があった場合には、再度、校正支援の必要性を判断するようにしている(ステップS4)。この点は、助詞の連続の場合と同じである。
【0121】
また、文節候補記憶部6には、1つの文が最後まで確定されるまで品詞情報等を保持されるようにしている。したがって、上記の処理は、未確定の文節に対してだけでなく、すでに確定された文節も含めて行うことができる。この点も、助詞の連続の場合と同じである。
【0122】
なお、上記実施形態では、前述のa1)a2)b1)c1)c2)c3)c4)d1)の何れかに示す条件を満たすものを常体としている。しかし、処理速度と校正支援の要求される度合い等の観点から、何れかを常体でないものとして扱ってもよい。また、その条件を緩和したり、厳しくしたりしてもよい。敬体についても同様である。
【0123】
【受身表現の判定】
次に、受身表現の判定処理について説明する。受身表現のある文節が見いだされたら、{受身表現}という校正支援情報を表示して、ユーザの注意を喚起する。この判定は、助動詞「れる」「られる」を含む文節があるか否かによって行う。たとえば、図16Aのように、「このように思われる。」という変換文字列候補であった場合には、「思われる」という文節が検出されて、受け身表示フラグが「1」となる。これを受けて、図16Aに示すように校正支援表示がなされる。
【0124】
【ら抜き表現の判定】
次に、ら抜き表現の判定処理について説明する。この実施形態では、ら抜き表現に該当する動詞を自立語辞書に登録する際に、「ら抜き表現」である旨を校正関連情報として記憶しておく。図3に示すように、「食べれ」に対して、校正関連情報として「ら抜き表現」を記憶しておく。CPU22は、図5のステップS2において、文節を生成する際に、この校正関連情報を文節候補記憶部6に記憶する。さらに、ステップS5、S6において、表示を行う際に、校正関連情報があれば当該文節の後にこれを表示する(図16B参照)。
【0125】
なお、校正関連情報としては、「ら抜き表現」にとどまらず、校正に有用な他の情報も記憶することができる。
【0126】
【校正支援情報の表示】
上記の各実施形態においては、対象となる変換文字列候補と同じ行に校正支援表示を行うようにしている。しかし、変換文字列候補と区別できる他の表示方法であってもよい。たとえば、図17に示すように、校正支援情報をバルーン100の中に表示してもよい。このようにすれば、異なる行に校正支援情報を表示できるので、入力している文の可読性が校正支援情報によって損なわれるおそれがない。また、校正支援情報を表示すべき文節との関連も不明瞭になることがない。ただし、入力行近傍の行の文字が隠されてしまい、読みづらくなってしまう。
【0127】
また、校正支援表示領域102を設けておき、入力文字の位置とは関係なく表示を行うようにしてもよい。この方法であれば、上記の欠点はないが、校正支援情報の有無が確認しづらい。
【0128】
また、図18に示すように表示を行ってもよい。つまり、注目文節のカーソルCKが校正支援表示を行うべき文節にない場合には、当該文節に※等のマークを表示する(図18A参照)。注目文節にカーソルCKが移動した場合には、図18Bに示すように、校正支援情報を表示する。また、注目文節カーソルの移動ではなく、※をマウス等によってダブルクリックすることで表示するようにしてもよい。
【0129】
また、画面上での表示だけでなく、音声等によって情報を出力してもよい。さらに、他のソフトウエア等に対して、データ等によって出力するようにしてもよい。
【0130】
上記の各表示方法は、それぞれ単独で用いてもよく、2以上の方法を併用してもよい。
【0131】
【その他】
上記の各実施形態では、校正支援情報を表示するだけであったが、校正候補を表示し、これをユーザに選択させ、訂正入力とするようにしてもよい。
【0132】
また、上記の各校正支援を行うか否かは、各校正支援ごとにユーザが選択できるようにしている。
【0133】
上記各実施形態では、図1の各機能をCPUを用いて実現しているが、その一部または全部をハードウエアロジックによって構成してもよい。
【図面の簡単な説明】
【図1】この発明の一実施形態による校正支援機能付きの文字列変換装置の全体構成を示す図である。
【図2】図1の文字列変換装置をCPUを用いて実現した場合のハードウエア構成を示す図である。
【図3】自立語辞書8のデータ構成を示す図である。
【図4】付属語辞書10のデータ構成を示す図である。
【図5】変換処理および校正支援処理の全体を示すフローチャートである。
【図6】文節生成処理を概念的に示すための図である。
【図7】文節候補記憶部6の記憶内容を示す図である。
【図8】変換処理における文字列変換候補を示す図である。
【図9】助詞の連続判定のフローチャートである。
【図10】助詞の連続を校正支援情報として表示する形態を示す図である。
【図11】フラグテーブルを示す図である。
【図12】修飾語の連続判定のフローチャートである。
【図13】修飾語の連続を校正支援情報として表示する形態を示す図である。
【図14】文体判定のフローチャートである。
【図15】文体に関する校正支援情報を表示する形態を示す図である。
【図16】その他の校正支援情報の表示を示す図である。
【図17】校正支援情報の表示方法を示す図である。
【図18】校正支援情報の他の表示方法を示す図である。
【符号の説明】
2・・・変換手段
4・・・かな文字列記憶部
6・・・文節候補記憶部
8・・・自立語辞書
10・・・付属語辞書
14・・・文節生成手段
16・・・文節候補選定手段
18・・・構校正援手段
20・・・表示手段
[0001]
BACKGROUND OF THE INVENTION
The present invention relates to character string conversion, and more particularly to a technique for supporting proofreading of the converted character string.
[0002]
[Prior art and problems]
A system for converting a given kana character string into a character string including kanji has been put into practical use. This system is used in a Japanese word processor or the like as a system (kana-kanji conversion system) for inputting kana characters and converting them into kanji-kanji sentences.
[0003]
In such a kana-kanji conversion system, it is determined by the user to use whether or not the converted kanji magic sentence is appropriate as Japanese. That is, it is determined whether or not the text is appropriate while the text is input using the Kana-Kanji conversion system, or whether the text is appropriate after the text is printed.
[0004]
However, the calibration work as described above is not always easy, and there are cases where sufficient calibration cannot be performed depending on the user.
[0005]
SUMMARY OF THE INVENTION An object of the present invention is to provide a character string conversion apparatus and method that can solve the conventional problems as described above and can easily perform proofreading.
[0006]
[Means for Solving the Problems]
This invention The string converter is
A dictionary that stores the converted character string and its part of speech in association with the kana character string;
With reference to the dictionary, a conversion character string candidate obtained by dividing a given kana character string into a conversion character string by dividing it into clauses is output, and upon receiving a confirmation command, the selected conversion character string candidate is determined as a confirmation character Conversion means for outputting as a column;
Proofreading support means for performing output for proofreading support based on the part of speech of each phrase in the conversion character string candidate,
It has.
[0007]
This invention In the character string conversion device, the proofreading support means determines whether or not an adjunct in each phrase in the conversion character string candidate is a particle, and if the phrase having the same particle continues for a predetermined number of times, the particle continues. It is characterized in that it outputs a calibration support output to the effect.
[0008]
This invention In the character string conversion device, the proofreading support means determines whether or not each phrase is in a combination modification usage in the conversion character string candidate. It is characterized in that it provides a proofreading support output indicating that words are continuous.
[0009]
This invention When the proofreading support means finds a phrase composed of any one of a) a conjunction, a b) a conjunction form of a predicate, and c) a combination of a noun equivalent and a particle equivalent, It is determined that the application method of the combination modification is continued once, and after this clause, a) a conjunction, b) a combined form of a predicate, c) a combination of a noun equivalent and a particle equivalent, d) a noun and a particle “no” It is characterized in that it determines the continuation of the clauses of the link-modifying usage based on how many times the clauses constituted by any of the combinations of the above are continued.
[0010]
This invention In the character string conversion apparatus, the proofreading support means determines whether the sentence is normal or respected based on the part of speech of the phrase in the converted character string candidate, and performs proofreading support output based on the determination It is characterized by being.
[0011]
This invention In the character string conversion device, the proofreading support means that the conversion character string candidate clause is “is”, “mass”, “has”, or other usages of these, “please” “please” “ It is characterized in that it is determined to be a respectful body when it includes “Speaking”.
[0012]
This invention The character string conversion device is characterized in that the proofreading support means determines that the conversion character string candidate clause is normal when the clause immediately before the punctuation mark or symbol is one of the following: Yes.
[0013]
a) Combination of body words and final particle "ka"
b) A combination of body language, “no” and final particle
c) When the last phrase or auxiliary verb in the clause is imperative
d) When the last sentence of the phrase is a combination of a final form and a connective particle
e) When the last sentence of the clause is a combination of final form and final particle
f) When the last sentence of the clause is a combination of a combination form and a connective particle
g) When the last sentence of the clause is a combination of final form and final particle
h) When the last sentence of the clause is a combination of a combination form, “no” and a final particle
This invention The character string conversion device of the above is characterized in that if the predetermined “normal” or “respected” style and the style determined by the proofreading support means are different, the output indicating that the style is different is performed. It is said.
[0014]
This invention When the proofreading support means determines that the sentence style of each phrase is not the same for one sentence converted character string candidate, the proofreading support means performs a proofreading support output indicating that the style has changed. It is a feature.
[0015]
This invention The character string conversion device of the present invention is characterized in that the proofreading support means outputs a proofreading support output indicating that it is a passive expression when the phrase includes the auxiliary verbs “de” and “being”.
[0016]
This invention The string converter is
A dictionary storing conversion character strings and proofreading related information in association with kana character strings;
With reference to the dictionary, a conversion character string candidate obtained by dividing a given kana character string into a conversion character string by dividing it into clauses is output, and upon receiving a confirmation command, the selected conversion character string candidate is determined as a confirmation character Conversion means for outputting as a column;
The conversion means is proofreading support means for performing an output for proofreading support based on the proofreading related information obtained from the dictionary in association with each phrase;
It has.
[0017]
This invention The character string converting apparatus is characterized in that a converted character string candidate for a given character string is displayed on a display screen, and proofreading support information for the converted character string candidate is also displayed or output by voice.
[0018]
This invention This character string conversion device is characterized in that the proofreading support information is displayed in the vicinity of the conversion character string candidate and on a different line from the conversion character string candidate.
[0019]
This invention The character string converting apparatus is characterized in that the proofreading support information is displayed on the same line as the character string candidate.
[0020]
This invention The character string conversion apparatus is characterized in that the proofreading support information is displayed at a predetermined position irrespective of a predetermined display position of the character string candidate.
[0021]
This invention The character string conversion device displays a conversion character string candidate for the given kana character string on the display screen, displays that there is proofreading support information for each phrase of the converted character string candidate, and also provides proofreading support information The feature is that the proofreading support information is displayed only when the cursor is moved to the phrase that is displayed.
[0022]
This invention In the character string conversion method, the conversion character string and its part of speech are stored in a dictionary in advance in association with the kana character string, and the given kana character string is divided into phrases and converted characters by referring to the dictionary. In a character string conversion method for outputting a conversion character string candidate converted into a string and receiving a confirmation command and outputting the selected conversion character string candidate as a confirmation character string, based on the part of speech of each phrase in the conversion character string candidate It is characterized by the fact that output for calibration support is performed.
[0023]
This invention The character string conversion method of (2) determines whether or not the ancillary word in each clause in the converted character string candidate is a particle, and if a phrase having the same particle continues for a predetermined number of times, the particle indicates that the particle is continuous. It is characterized by performing calibration support output.
[0024]
This invention In the conversion string candidate, it is determined whether or not each clause is in a linkage modification usage, and if the linkage modification usage clause continues more than a predetermined number of times, the modifier continues. It is characterized in that it provides a calibration support output to the effect.
[0025]
This invention The character string conversion method of the method determines whether the sentence is normal or respected based on the part of speech of the phrase in the converted character string candidate, and performs proofreading support output based on the determination. It is a feature.
[0026]
This invention This character string conversion method is characterized in that, when a phrase in a converted character string candidate includes auxiliary verbs “de” and “re”, a proofreading support output indicating passive expression is performed.
[0027]
This invention In the character string conversion method, the conversion character string and the proofreading related information are stored in a dictionary in advance in association with the kana character string, and the kana character string is divided into phrases and converted into the conversion character string by referring to the dictionary. In the character string conversion method for outputting the converted converted character string candidate and receiving the confirmation command and outputting the selected converted character string candidate as the confirmed character string, the calibration related information obtained from the dictionary in association with each phrase Based on the above, an output for calibration support is performed.
[0028]
This invention This character string conversion method is characterized in that a converted character string candidate for a given kana character string is displayed on a display screen, and proofreading support information for the converted character string candidate is also displayed or output by voice.
[0029]
The terminology used to describe this invention is as follows.
[0030]
The “kana character string” is a concept including not only a character string including only a kana character string but also a character string having alphabets, katakana, symbols, and the like.
[0031]
The “conversion character string” refers to a character string composed of kanji, kana, katakana, alphabet, symbols, etc. alone or in combination.
[0032]
“Conversion character string candidate” refers to a candidate for a conversion character string. It is a concept that includes not only all indeterminate states but also some that have definite portions.
[0033]
“One sentence” refers to one sentence that ends with a punctuation mark or the like.
[0034]
The “cursor” refers to a display on the screen for clarifying the input area and the control target area. The attention phrase cursor CK in the embodiment corresponds to this.
[0035]
“Output of proofreading support information” means displaying or printing the proofreading support information or giving it to other software as data. Further, it is a concept including notifying a human by voice or vibration.
[0036]
The “storage medium” refers to a computer-readable medium such as a flexible disk, a hard disk, or a CD-ROM that can fix a program.
[0037]
“Computer-executable program” can be executed not only when the program stored in the storage medium can be directly executed, but also when combined with a program that can be executed by installation or other programs. Indirectly executable programs such as programs are also included.
[0038]
【The invention's effect】
This invention Character string converter and This invention This character string conversion method is characterized in that an output for proofreading support is performed based on the part of speech of each phrase in the converted character string candidate. Accordingly, it is possible to provide proofreading support information during the character string conversion operation.
[0039]
This invention Character string converter and This invention This character string conversion method is characterized in that when a phrase having the same particle continues for a predetermined number of times, a proofreading support output indicating that the particle is continuous is performed. Therefore, an inappropriate continuous state of particles can be given as proofreading support information at the time of character string conversion operation.
[0040]
This invention Character string converter and This invention This character string conversion method is characterized in that, in the conversion character string candidate, when the clauses of the combination modification usage continue for a predetermined number of times or more, a proofreading support output indicating that the modifiers are continued is performed. Therefore, an inappropriate continuous state of modifiers can be given as proofreading support information during a character string conversion operation.
[0041]
This invention When the proofreading support means finds a phrase composed of any one of a) a conjunction, a b) a conjunction form of a predicate, and c) a combination of a noun equivalent and a particle equivalent, Judging that the method of application of the conjunctive modification was continued once, and after the clause, a) a conjunction, b) a combined form of a predicate, c) a combination of a noun equivalent and a particle equivalent, d) a noun and a particle “no” It is characterized in that it determines the continuation of the clauses of the combination modification usage based on how many times the clauses constituted by any one of the above combinations continue. Therefore, it is possible to detect a series of inappropriate modifiers more accurately.
[0042]
This invention Character string converter and This invention The character string conversion method of the method determines whether the sentence is normal or respected based on the part of speech of the phrase in the converted character string candidate, and performs proofreading support output based on the determination. It is a feature. Therefore, it is possible to give the style as proofreading support information during the character string conversion operation.
[0043]
This invention In the case of the character string conversion device of, when the phrase of the conversion character string candidate is "is""mas" or "you are" or other usages of these, or "please""please""please" It is characterized by judging that it is a respectful body. Therefore, it is possible to detect the honorable body more accurately.
[0044]
This invention The character string converting apparatus is characterized in that it is determined to be normal when a phrase immediately before a punctuation mark or a symbol is one of the following among the phrases of the converted character string candidate. a) a combination of the body and the final particle “ka”, b) a combination of the body and the “no” and the final particle, c) if the last sentence or auxiliary verb is imperative, and d) the last sentence of the section is terminated. In the case of a combination of a form and a connective particle, e) In the case where the last sentence of the clause is a combination of a final form and a final particle, f) In the case where the last sentence of the clause is a combination of a combined form and a particle, g) When the last word is a combination of a final form and a final particle, h) When the last sentence of a phrase is a combination of a combined form, “no”, and a final particle. Therefore, the normal substance can be detected more accurately.
[0045]
This invention The character string conversion device of the above is characterized in that if the predetermined “normal” or “respected” style and the style determined by the proofreading support means are different, the output indicating that the style is different is performed. It is said. Therefore, it is possible to give, as proofreading support information, that a sentence style different from the scheduled style is input during the character string conversion process.
[0046]
This invention The character string converting apparatus is characterized in that, for a converted character string candidate of one sentence, when it is determined that the style of each phrase is not the same, a proofreading support output indicating that the style has changed is performed. Accordingly, it is possible to provide the proofreading support information that a sentence with a changed style is input during the character string conversion process.
[0047]
This invention Character string converter and This invention This character string conversion method is characterized in that, when a phrase in a converted character string candidate includes auxiliary verbs “de” and “re”, a proofreading support output indicating passive expression is performed. Therefore, at the time of character string conversion processing, information indicating passive expression can be given as proofreading support information.
[0048]
This invention Character string converter and This invention This character string conversion method is characterized in that output for proofreading support is performed based on proofreading related information obtained from a dictionary in association with each phrase. Therefore, the proofreading support information can be given based on the information obtained from the dictionary during the character string conversion process.
[0049]
This invention Character string converter and This invention This character string conversion method is characterized in that the proofreading support information for the converted character string candidate is displayed or output by voice. Therefore, it is possible to easily obtain proofreading support information corresponding to the display of the conversion character string candidate.
[0050]
This invention This character string conversion device is characterized in that the proofreading support information is displayed in the vicinity of the conversion character string candidate and on a different line from the conversion character string candidate. Therefore, it is easy to visually confirm the calibration support information.
[0051]
This invention The character string converting apparatus is characterized in that the proofreading support information is displayed on the same line as the character string candidate. Therefore, it is easy to visually confirm the calibration support information.
[0052]
This invention The character string conversion apparatus is characterized in that the proofreading support information is displayed at a predetermined position irrespective of a predetermined display position of the character string candidate. Therefore, the display position of the calibration support information is fixed and easy to confirm.
[0053]
This invention The character string conversion device displays the fact that there is proofreading support information for each phrase of the conversion character string candidate and proofreads only when the cursor is moved to the phrase for which proofreading support information exists. It is characterized by displaying support information. Therefore, the presence / absence of the calibration support information can be easily confirmed, and the display necessary range of the contents can be reduced.
[0054]
DETAILED DESCRIPTION OF THE INVENTION
FIG. 1 shows the overall configuration of a character string conversion apparatus according to an embodiment of the present invention. In this embodiment, the kana character string storage unit 4, the phrase candidate storage unit 6, the phrase generation unit 14, and the phrase candidate selection unit 16 constitute the conversion unit 2. Further, a dictionary 12 is constituted by the independent word dictionary 8 and the attached word dictionary 10.
[0055]
The “kana character string” given to the conversion means 2 is stored in the kana character string storage unit 14. The phrase generation unit 14 refers to the dictionary 12 and generates a possible phrase from the “kana character string” stored in the kana character string storage unit 14. The phrase generation unit 14 stores the generated phrase in the phrase candidate storage unit 6. That is, the kanji, the part of speech, the utilization form, the proofreading related information, etc. acquired from the dictionary for the independent words and the attached words of each phrase are stored. The phrase candidate selection means 16 finds possible phrase paths by combining the phrases stored in the phrase candidate storage unit 6. When there are a plurality of possible phrase paths, the phrase path (converted character string candidate) is narrowed down to one by a predetermined selection process.
[0056]
The phrase candidate selection means 16 sends this converted character string candidate to the display means 20 for display. Further, when a change command is given, different conversion character string candidates are displayed on the display means 20. When a confirmation command is given, the converted character string candidate is output as a confirmed character string.
[0057]
The proofreading support means 18 generates proofreading support information based on the part of speech of the phrase stored in the phrase candidate storage unit 6 and outputs it to the display means 20 for display. Further, based on the proofreading related information related to the phrase stored in the phrase candidate storage unit 6, the proofreading support information is generated and output to the display means 20 for display.
[0058]
FIG. 2 shows a hardware configuration when the character string conversion apparatus of FIG. 1 is realized using a CPU. Connected to the bus line 34 are a CPU 22, a hard disk 24, a display 20 as a display means, a memory 28, a flexible disk controller (FDD) 30, and a keyboard 32. The hard disk 24 stores an independent word dictionary 8, a character string conversion processing program 40, a proofreading support processing program 42, and the like. These are installed from the flexible disk (FD) 36 via the FDD 30. Of course, it may be taken from a CD-ROM or the like. Alternatively, it may be downloaded via a communication line.
[0059]
The memory 28 is provided with a kana character string storage unit 4 for storing kana character strings and a phrase candidate storage unit 6 for storing phrase candidates. An attached word dictionary 10 is also provided.
[0060]
FIG. 3 shows the data structure of the independent word dictionary 8. An independent word is a word that can be a phrase by itself. The independent word dictionary 8 stores kanji corresponding to the character string (reading) to be converted. Corresponding to these, parts of speech and proofreading related information are stored. Note that kana characters are generally stored in the “reading” column, but some or all of them may include alphabets. In the “kanji” column, not only kanji but also kana and alphabets may be stored.
[0061]
FIG. 4 shows the data structure of the attached word dictionary 10. An adjunct is a word that cannot be a phrase by itself. The ancillary dictionary 10 stores an ancillary word, its corresponding part of speech, and a utilization form correspondingly. The parts of speech are classified and stored as particles, auxiliary verbs, and idioms. The particles are further classified and stored as case particles, connection particles, adjunct particles, and final particles. In addition, with respect to the endings of the idioms, the utilizable forms (pre-form, continuous form, end form ... instruction form) are stored. Furthermore, it is also remembered which word each appendage can be used after (an independent word / adjunct that can precede).
[0062]
The part of speech classification used in this embodiment is shown below.
[0063]
General nouns: common nouns attached to objects and states
Nouns Sa-no: Nouns that can be followed by a sa-var
The noun the weird: a noun that can be followed by the variator "Zuru"
Noun movement: A noun that expresses the figure, state, nature, etc. of each object and can add “da” or “na” behind it.
Independent words: words that do not have verbs or auxiliary verbs and have no connection to other words
Conjunctive: a word that is not used and that only modifies the body
Conjunctions: words used to continue words
Impression verb: A word for impression, response, call, etc.
Prefix: Words used in front of other
Suffix: words used after other words
Numerals: words that count and express quantity
Verbs: Further subdivided by usage
Adjective: A word that represents the nature and state of a thing and ends with “i”
Adjective verb: A word that expresses the nature and state of a thing and ends with “da” or “na”
Adverb: a word that mainly modifies the idiom
[0064]
[Outline of conversion process and calibration support process]
FIG. 5 shows a flowchart of the character string conversion program 40 and the proofreading support program 42. Both programs may be integrated, or a part or all of them may be modularized and separated. According to this flowchart, the process of converting the kana character string “I have Japanese language” will be explained. First, when the kana character string is input from the keyboard 32 (step S1), the CPU 22 stores it in the kana character string storage unit 4 in the memory 28 (see FIG. 6).
[0065]
Next, the CPU 22 searches the independent word dictionary 8 and the attached word dictionary 10 in order from the first kana character in the kana character string in the kana character string storage unit 4 to generate a phrase (step S2). That is, all possible phrases are generated and stored in the phrase candidate storage unit 6 in the memory 28. FIG. 6 shows the phrases stored in the phrase candidate storage unit 6 in this way in association with the kana character string. In the figure, α1, α2, α3, α4, β1,... Are generated. The phrases α1 to α4 are kanji (and attached words) corresponding to the search character string starting with “wa”. The phrase α1 has a search character string of one character, the phrase α2 has two characters, the phrase α3 has three characters, and the phrase α4 has four characters. For each length of search character string, only one phrase is stored as a candidate. In other words, in the phrase α1, many kanji characters are searched in addition to “sum”, but only one kanji “sum” having the highest priority is selected in consideration of the frequency of use and the relationship with the preceding and following words. is doing. The same applies to the phrases α2, α3, and α4.
[0066]
The phrases β1, β2, and β3 are kanji (and attached words) corresponding to the search character string starting with “ta”. Similarly, all possible phrases are stored in the phrase candidate storage unit 6. When storing, as shown in FIG. 7, the part of speech, utilization form, and proofreading related information (described later) acquired from the dictionary are also stored. The phrase position information, that is, the information corresponding to which part of the kana character string is stored, but is omitted in FIG.
[0067]
When the phrase generation and the phrase candidate storage unit 6 are completed as described above, the CPU 22 selects a phrase route candidate (step S3). In other words, it finds clauses that can be combined in association with kana character strings. For example, clauses β1 to β3 are the only clauses that can be continued with the “sum” of clause α1, and other clauses cannot be continued. This kind of consideration is performed up to the last phrase, and possible combinations of phrases (called phrase paths) are found. When a plurality of phrase paths are found, one of the highest priority phrase paths is selected based on the learning information and the relation between phrases. By selecting the phrase path in this manner, for example, a conversion character string candidate “I am / Japanese / processing / impressed / is /.” Is selected (/ represents a section break).
[0068]
Next, the CPU 22 determines the necessity of proofreading support based on the part of speech of each phrase of the converted character string candidate (step S4). If proofreading support is necessary, proofreading support information is also displayed when the converted character string candidate is displayed on the display 20 (step S5). If there is no need for calibration support, only the converted character string candidates are displayed on the display 20 (step S6). A display example is shown in FIG. 8A. In the figure, the phrase “I am” is surrounded by a cursor CK. This indicates that the phrase that is the current processing target (referred to as the focused phrase) is “I am”. Note that the process of determining whether or not calibration support is necessary will be described in detail later.
[0069]
After displaying the converted character string candidates, the process waits for a command from the user (step S7). The user views the conversion character string candidates displayed on the display 20 and inputs various commands from the keyboard 32 (may be a mouse or the like).
In step S7, when a movement command for the target phrase is input, the CPU 22 moves the target phrase in accordance with the commanded direction, and also moves the display of the cursor CK. For example, in the state of FIG. 8A, when a command to move the target phrase to the right is given, the cursor CK moves to the right and “Japanese” becomes the target phrase as shown in FIG. 8B. Further, when an instruction to move to the right twice is given, as shown in FIG. 8C, the cursor CK of the target phrase moves to “I'm impressed”.
[0070]
In step S7, when an instruction for another candidate is given, other candidates are selected from the independent word dictionary 8 and the attached word dictionary 10 for the independent word and the attached word of the noticeable phrase “Kansei ga” (step S10). For example, select “I am interested”. At this time, the CPU 22 rewrites the “impressive” part of the phrase candidate storage means 6 shown in FIG. 7 into “interested”, and newly acquires part-of-speech, usage forms, proofreading related information, and the like from the dictionary. Rewrite to Thereafter, the new conversion character string candidate is again checked for the need for proofreading support (step S4) and displayed (steps S5 and S6). That is, a display as shown in FIG. 8D is performed.
[0071]
When a post-conversion command is given in step S7, the entire noticeable phrase is post-converted according to the content of the command (step S12). For example, when a post-conversion command to katakana is given, the entire noticeable phrase is changed to “kansinga” as shown in FIG. 8E. In response to this, the contents of the phrase candidate storage unit 6 in FIG. 7 are also rewritten in the same manner as described above. However, since this word is not obtained from the dictionary (referred to as post-conversion word), it is forced to be a general noun in the part of speech column.
[0072]
When a phrase segment change command is given in step S7, the target phrase is lengthened (or shortened) (step S11), and a phrase path candidate is selected again based on the stored contents of the phrase candidate storage unit 6. (Step S3). That is, a new converted character string candidate having a different phrase break position is generated. The subsequent processing is the same as the processing described above, and after determining whether or not the calibration support is necessary again, display is performed (steps S4, S5, and S6).
[0073]
When the confirmation command is input through the above processing, the converted character string candidate at that time is output as a confirmed character string (converted character string) to an application or the like (word processor software or the like) (step S8). In this embodiment, the calibration support information is not output to an application or the like. However, since the calibration support information may be useful on the application side, it may be output after clarifying that it is the calibration support information. In particular, since the proofreading support information is attached, it is possible for the application side to determine that the user wanted to use such an expression even against the displayed proofreading support.
[0074]
In step S8, the display color on the screen is changed to clarify that the character string is confirmed. Also, the display of the calibration support information is stopped.
[0075]
If one sentence is over when the confirmation command is given and a confirmed character string is output (the sentence ends with “.”), The contents of the phrase candidate storage unit 6 in FIG. 7 are cleared. When a confirmation command is issued in the middle of a sentence, the contents of the phrase candidate storage unit 6 are held as they are. That is, in this embodiment, the contents of the phrase candidate storage unit 6 are held until all the phrases of one sentence are confirmed.
[0076]
[Process of continuous judgment of particle]
Next, the process for determining whether or not calibration support is necessary in step S4 will be described. In this embodiment, the judgment in step S4 is performed for continuation of particles, continuation of modifiers, style, passive expression, and the like. First, particle continuation determination processing will be described with reference to the flowchart of FIG.
[0077]
The continuation of particles here means that the particles “no” and “ga” are consecutive, such as “My child's problem…” and “Hurry up on the bicycle…”. This is the case where there is a high possibility of becoming. In such a case, as shown in FIG. 10A, a proofreading support of {continuous particle} is displayed to give a notice to that effect to the user. It is a clause that includes noun equivalents (general nouns, proper nouns, nouns varieties, numbers, suffixes, classifiers, post-conversion words), and the particles at the end of the adjuncts are "no""de""ga" Judgment is made on what is "O".
[0078]
First, in step S20, the CPU 22 stores in the memory 28 a counter N for “no”, a counter D for “de”, a counter G for “ga”, and a counter WO for “o”. Secure and clear the contents. Next, it is determined whether or not the first phrase (“I” in FIG. 10A) of the converted character string candidate includes a noun equivalent (step S21). This determination is made by referring to the stored contents of the phrase candidate storage unit 6 (see FIG. 7). For example, since “me” is stored as “general noun, case particle”, it is determined that the phrase includes a noun equivalent word.
[0079]
If the phrase includes a noun equivalent word, it is determined whether or not the phrase includes an appendix (step S22). As described above, with regard to “my”, the “case particle” that is an appendix is stored in the phrase candidate storage unit 6, and therefore, it is determined that the appendix includes the appendix. Further, it is determined whether or not the end of the attached word is a particle (step S23). Here, it is determined to be a particle.
[0080]
If it is determined that the particle is a particle, the type of the particle is examined (step S24). Here, since it is “no”, the process proceeds to step S25, and the counter N is incremented. Next, it is determined whether or not the counter N is “1” (step S26). Since the counter N is “1” at the beginning of the sequence of “no”, the process returns to step S21 via steps S27, S28, S29, S30, and S33. That is, the above process is repeated for the next phrase “child”. Thereby, when the particle “no” continues, the number of times can be stored in the counter N.
[0081]
It should be noted that in the step S24, the flowchart when “de”, “g” and “m” are omitted. In these cases, the same process as “no” is performed.
[0082]
For example, in the case of the conversion character string candidate as shown in FIG. 10A, the value of the N counter becomes “3” when the processing of the last phrase is finished. Thereafter, when it is determined in step S30 that there is no clause after this, the process proceeds to step S31. In step S31, it is determined whether any of the counters N, G, D, and WO is equal to or greater than a predetermined value. In this embodiment, the predetermined values for counters N and G are “3”, and the predetermined values for counters D and WO are “2”. That is, the calibration support is performed by repeating three times or more for “no” and “ga” and repeating two or more times for “de” and “wo”. Here, since the counter N is “3” and is equal to or greater than a predetermined value, a flag indicating that the particle continues is set for the current phrase. That is, as shown in FIG. 11A, the continuous particle item is set to “1” in the column of the phrase number 3 in the flag table.
[0083]
In step S5 of FIG. 5, based on this flag, the proofreading support information {continuous particle} is displayed after the third phrase (see FIG. 10A).
[0084]
In the process of continuously determining particles in FIG. 9, when different particles continue, the counter is cleared (step S29). Therefore, as shown in FIG. 10B, when the particle “I” is inserted in the middle, even if there are three particles “NO” as a whole, the proofreading support information of {continuous particle} is not output. However, as illustrated in FIG. 10C, when there is a noun equivalent “immediate” having no attached word, the counter is not cleared and the count is continued. That is, counter clearing is not provided in the processing paths of steps S22, S30, S33, and S21.
[0085]
Further, in this embodiment, as shown in FIG. 10D, the proofreading support information is displayed at the end of the continuous phrase of the particle rather than being displayed immediately after the phrase exceeding the predetermined value.
[0086]
Since the flag table as shown in FIG. 11A is provided, the proofreading support information can be displayed even in the middle of the converted character string candidate as shown in FIG. 10E. Although omitted in the flowchart, as shown in FIG. 10F, the counter is cleared when there are punctuation marks or symbols in the middle.
[0087]
Further, in step S23, even if the particles "~ dano", "~ mono", "~ no de", "~ yo de", and "~ so de" come to the end, the process branches to step S35. This is also omitted in the flowchart.
[0088]
As is clear from the overall flowchart of FIG. 5, when there is a change in candidate or a change in phrase break, the necessity for proofreading support is determined again (step S4). For example, in the state shown in FIG. 10A, when “child” is changed to “this” which is a conjunction, the display of the calibration support information disappears as shown in FIG. 10G. Similarly, if “my” is changed to “watashino” by post-conversion, the part of speech is only a noun, so the display of the proofreading support information disappears as shown in FIG. 10H.
[0089]
The phrase candidate storage unit 6 holds part-of-speech information and the like until one sentence is finalized. Therefore, the above-described processing can be performed not only for an undetermined phrase but also for an already confirmed phrase. For example, in FIG. 10A, even when “my” and “child” are confirmed and only “problem” is not confirmed, the calibration support information is displayed in the same manner. Therefore, calibration support with higher practicality can be performed.
[0090]
[Continuous judgment of modifiers]
Next, the modifier continuous determination process will be described. Here, a series of modifiers means that if there are three or more consecutive clauses of a combination modifier, for example, a sentence such as “white / large / cage / inside ...” This is a case where there is a high possibility that it will be unclear. In such a case, as shown in FIG. 13A, a proofreading support message of {continuation of modifiers} is displayed to give a notice to that effect to the user.
[0091]
With reference to the flowchart of FIG. 12, the process of a modifier continuous determination is demonstrated. First, in step S40, a plurality of clauses that are combined in the order of a noun equivalent word and a particle equivalent word (according to, in terms of to) are searched for from the converted character string candidates. Such a plurality of clauses is regarded as a clause of one linkage modifying usage (step S40). This determination can be made based on the stored contents of the phrase candidate storage unit 6. For example, the sentence “patent” is composed of a phrase composed of a combination of a general noun “case of patent” and a case particle, and a phrase composed of a combination of a verb stem “used” and an inflection ending. In step S40, the two clauses are regarded as one linkage-modifying usage clause. This is because it can be regarded as a combination of a noun equivalent of “patent” and a particle equivalent of “about”. However, only one phrase is considered in the modifier continuous determination process.
[0092]
Next, the CPU 22 secures a counter R for the modifier in the memory 28 and clears the contents (step S41). First, it is determined whether or not the part-of-speech of the first phrase is a conjunction (any, great, bad, etc.) (step S42). This determination can also be made by referring to the “part of speech” column of the phrase candidate storage unit 6 (see FIG. 7). If it is a conjunction, the counter R is incremented (step S49). Then, the next phrase is analyzed.
[0093]
If it is not a conjunction, it is determined whether or not the clause is a conjunction of a predicate (verb, adjective, adjective verb) (step S43). It can be determined by referring to the “part of speech” column of the phrase candidate storage unit 6 and whether it is a combined form or not by referring to the “utilization” column. If it is a continuation form (for example, white, energetic, large, etc.), the counter R is incremented (step S49), and the next phrase is analyzed.
[0094]
If it is not the union form of the predicate, it is determined whether or not the phrase corresponds to the union usage determined in step S40 (step S44). If the usage is a combination modification, the counter R is incremented (step S49), and the next phrase is analyzed.
[0095]
If it is not the combined modification usage, it is determined whether or not the phrase is composed of a combination of a noun and a case particle “no” (step S45). If not (that is, if it is not any of the linkage-modifying usages in steps S42 to S45), the counter R determines the number of consecutive linkage-modifying usages (step S46). If the counter R is “3” or more, a modifier continuous flag is set for the phrase immediately preceding the current phrase (see FIG. 11).
[0096]
If the last phrase is reached in step S52, it is similarly determined whether the value of the counter R is “3” or more (step S54). If the number is 3 or more, the modifier continuous flag in FIG. 11 is set for the current phrase. For example, in the case of a conversion candidate character string as shown in FIG. 13A, a flag is set for the fourth phrase as shown in FIG. 11B.
[0097]
In step S5 in FIG. 5, based on this flag, proofreading support information {continuation of modifiers} is displayed after the fourth clause (see FIG. 13A).
[0098]
In this embodiment, the continuation of modifiers is not started by a clause composed of a combination of a noun and “no”. That is, when the counter R is “0”, the counter R is not incremented (step S50). Therefore, the proofreading support information is not displayed for the conversion candidate character string as shown in FIG. 13B. However, once the continuation of modifiers starts, the counter R is incremented due to the presence of a clause with a combination of a noun and “no” (steps S50 and S51). Therefore, the proofreading support information is displayed for the conversion candidate character string as shown in FIG. 13A.
[0099]
In the modifier continuous determination process of FIG. 12, if there is a clause that is not a clause of the combined modifier usage, the counter R is cleared (steps S45, S46, S48, S, 49, S41). ). Therefore, as shown in FIG. 13C, if there is a phrase “in” in the middle, the proofreading support information {continuation of modifiers} will not be output even if there are three phrases in the combined modification usage as a whole. However, as shown in FIG. 13D, when there is a noun equivalent “bamboo” having no attached word, the counter R is not cleared and the count is continued. Therefore, the calibration support information is displayed. This process is omitted in the flowchart of FIG.
[0100]
Further, in this embodiment, as shown in FIG. 13A, instead of displaying immediately after the phrase “cage” exceeding the predetermined value, the last phrase “in” in the consecutive linkage-modifying usage phrase The calibration support information is displayed later.
[0101]
Since the flag table as shown in FIG. 11B is provided, the proofreading support information can be displayed even in the middle of the converted character string candidate as shown in FIG. 13E. Although omitted in the flowchart, as shown in FIG. 13F, the counter is cleared when there are punctuation marks or symbols in the middle.
[0102]
As is clear from the overall flowchart of FIG. 5, when there is a change in candidate or a change in phrase break, the necessity for proofreading support is determined again (step S4). This is the same as in the case of continuous particles.
[0103]
The phrase candidate storage unit 6 holds part-of-speech information and the like until one sentence is finalized. Therefore, the above-described processing can be performed not only for an undetermined phrase but also for an already confirmed phrase. This is also the same as the case of particle continuation.
[0104]
In the above-described embodiment, what satisfies the condition shown in any of Steps S42, S43, S44, and S45 is a clause of a combined modification usage. However, from the viewpoint of the processing speed and the degree of required calibration support, any of them may be treated as not being a combined modification usage. In addition, the conditions may be relaxed or tightened.
[0105]
[Style determination]
Next, the style determination process will be described. Here, the stylistic means whether it is a delicate expression (respected body, more and more keys) or a normal expression (normal body, more keys). In this embodiment, if the user specifies a style in advance, and the style of the converted character string candidate is different from that of the conversion character string candidate, a calibration support display of {a key} or {mass key} is performed, The user is warned to that effect.
[0106]
The style determination process will be described with reference to the flowchart of FIG. First, in step S60, the CPU 22 sets a honorific flag K and a normal flag J in the memory 28, and clears the contents. Next, it is determined whether or not the first phrase of the conversion character string candidate includes any of the auxiliary verbs “is”, “mass”, and “we are” (including all the utilization forms) (step S61). This can be determined based on the stored contents of the phrase candidate storage unit 6. If it is included, it is determined to be a honorable body, and the honorable body flag K is set to “1” (step S65). For example, as shown in FIG. 15A, when the conversion character string candidate is “I am a cat”, the first phrase “I'm a cat” does not include the auxiliary verb. Accordingly, the process proceeds to step S62.
[0107]
In step S62, it is determined whether or not the clause includes the imperative command forms "please", "please", and "please" (La line special). This determination can also be made with reference to the “part of speech” and “utilization” columns of the phrase candidate storage unit 6. If it is included, it is determined to be a honorable body, and the honorable body flag K is set to “1” (step S65). In the example of FIG. 15A, the first clause “student is” does not include the above-described command form, so the process proceeds to step S63.
[0108]
In step S63, it is determined whether or not the clause is immediately before a punctuation mark or symbol. Since “student” does not correspond to this, after steps S63 and S72, step S61 and subsequent steps are repeated for the next phrase.
[0109]
The next phrase “is a cat” does not correspond to any of steps S61 and S62. Since “is a cat” is a phrase immediately before a punctuation mark, the process branches to step S64 in step S63. In step S64, it is determined whether or not the style is normal. In this way, the determination as to whether or not the object is normal is made based on the phrase immediately before the punctuation mark or symbol.
[0110]
In this embodiment, it is determined that the object is normal when any of the following conditions is satisfied.
[0111]
a1) When the phrase does not include a predicate and is a body + final particle "ka": Example "Is it a problem?"
a2) When the clause does not contain a predicate and is a body + "no" + final particle
b1) When the last phrase or auxiliary verb is imperative: Example “Think.”
c1) When the last sentence or auxiliary verb of the clause is a final form + connected particle: Example “Thinking,”
c2) When the last sentence or auxiliary verb of the clause is a final form + final particle
c3) When the last sentence or auxiliary verb of the clause is a combined form + connected particle
c4) When the last phrase or auxiliary verb is a final form + final particle
d1) When the last sentence of the clause is a combination form + "no" + final particle: example "Do you think?"
[0112]
Here, “being a cat” corresponds to the above, and is thus determined to be normal. Therefore, the normal flag J is set to “1” (step S71).
[0113]
The next phrase is “.”, Which ends the sentence, and branches from step S66 to S67. In step S67, it is determined whether the preset style (stored in the memory 28 with an area) is different from the determined style. If the setting style is “respect style”, it is different from the judgment style, so a style error display flag is set (step S68).
[0114]
In step S5 in FIG. 5, based on this flag, proofreading support information {key to be} is displayed after the last phrase (see FIG. 15B).
[0115]
In the above case, if the setting style is “normal”, it matches the determination style, so the proofreading support information is not displayed as shown in FIG. 15A.
[0116]
If the setting style is “normal” and the conversion character string candidate is as shown in FIG.
[0117]
Further, in step S69, it is determined whether or not the flags K and J are both “1”. The fact that both flags are “1” indicates that the style has changed in one sentence. For example, in the case of a converted character string candidate as shown in FIG. 15D, both flags are “1”. In this case, a style change display flag is set in step S70.
[0118]
In step S5 of FIG. 5, based on this flag, proofreading support information {changed style} is displayed after the last phrase (see FIG. 15D).
[0119]
In this embodiment, a change in style is determined for one sentence. However, if the previous sentence that has been finalized to the last phrase is stored in a buffer or the like, it is possible to determine the style change over a plurality of sentences.
[0120]
As is clear from the overall flowchart of FIG. 5, when there is a change in candidate or a change in phrase break, the necessity for proofreading support is determined again (step S4). This is the same as in the case of continuous particles.
[0121]
The phrase candidate storage unit 6 holds part-of-speech information and the like until one sentence is finalized. Therefore, the above-described processing can be performed not only for an undetermined phrase but also for an already confirmed phrase. This is also the same as the case of particle continuation.
[0122]
In the above-described embodiment, the one satisfying the conditions shown in any one of the aforementioned a1) a2) b1) c1) c2) c3) c4) d1) is used as a normal. However, from the viewpoint of the processing speed and the degree of required calibration support, any of them may be treated as not a normal one. In addition, the conditions may be relaxed or tightened. The same is true for respect.
[0123]
[Decision of passive expression]
Next, the passive expression determination process will be described. When a phrase with passive expression is found, proofreading support information {passive expression} is displayed to call the user's attention. This determination is made based on whether or not there is a phrase including the auxiliary verbs “re” and “re”. For example, as shown in FIG. 16A, in the case of a conversion character string candidate “I think this way”, the phrase “I think” is detected, and the passive display flag becomes “1”. In response to this, a calibration support display is made as shown in FIG. 16A.
[0124]
[Judgment of expression without omission]
Next, the process of determining the blank expression will be described. In this embodiment, when a verb corresponding to a free expression is registered in an independent word dictionary, the fact that it is a “free expression” is stored as proofreading related information. As shown in FIG. 3, “removed expression” is stored as proofreading-related information for “eaten”. The CPU 22 stores this proofreading related information in the phrase candidate storage unit 6 when generating a phrase in step S2 of FIG. Further, when displaying in steps S5 and S6, if there is proofreading related information, it is displayed after the relevant phrase (see FIG. 16B).
[0125]
Note that the proofreading related information is not limited to “rough expression” but can also store other information useful for proofreading.
[0126]
[Display of calibration support information]
In each of the above embodiments, the calibration support display is performed on the same line as the target conversion character string candidate. However, other display methods that can be distinguished from conversion character string candidates may be used. For example, the calibration support information may be displayed in the balloon 100 as shown in FIG. In this way, the proofreading support information can be displayed on different lines, so that the readability of the input sentence is not impaired by the proofreading support information. In addition, the relationship with the phrase for which the proofreading support information should be displayed does not become unclear. However, the characters in the line near the input line are hidden, making it difficult to read.
[0127]
Further, the proofreading support display area 102 may be provided so that display is performed regardless of the position of the input character. This method does not have the above-mentioned drawbacks, but it is difficult to confirm the presence or absence of calibration support information.
[0128]
Moreover, you may display as shown in FIG. That is, when the cursor CK of the target phrase is not in the phrase for which the proofreading support display is to be performed, a mark such as * is displayed in the corresponding phrase (see FIG. 18A). When the cursor CK moves to the target phrase, calibration support information is displayed as shown in FIG. 18B. Further, instead of moving the attention phrase cursor, it may be displayed by double-clicking * with a mouse or the like.
[0129]
In addition to display on the screen, information may be output by voice or the like. Furthermore, the data may be output to other software or the like.
[0130]
Each of the above display methods may be used alone or in combination of two or more methods.
[0131]
[Others]
In each of the above-described embodiments, only the calibration support information is displayed. However, calibration candidates may be displayed, and this may be selected by the user for correction input.
[0132]
Further, whether or not to perform each of the above-described calibration supports can be selected by the user for each calibration support.
[0133]
In each of the above embodiments, each function of FIG. 1 is realized using a CPU, but a part or all of the functions may be configured by hardware logic.
[Brief description of the drawings]
FIG. 1 is a diagram showing an overall configuration of a character string conversion apparatus with a proofreading support function according to an embodiment of the present invention.
FIG. 2 is a diagram illustrating a hardware configuration when the character string conversion device of FIG. 1 is realized using a CPU.
FIG. 3 is a diagram showing a data configuration of an independent word dictionary 8;
4 is a view showing a data structure of an attached word dictionary 10. FIG.
FIG. 5 is a flowchart showing the entire conversion process and proofreading support process.
FIG. 6 is a diagram conceptually illustrating a phrase generation process.
FIG. 7 is a diagram showing the contents stored in a phrase candidate storage unit 6;
FIG. 8 is a diagram showing character string conversion candidates in conversion processing;
FIG. 9 is a flowchart of particle continuation determination.
FIG. 10 is a diagram showing a form in which a series of particles is displayed as proofreading support information.
FIG. 11 is a diagram showing a flag table.
FIG. 12 is a flowchart of modifier continuous determination.
FIG. 13 is a diagram illustrating a form in which a series of modifiers is displayed as proofreading support information.
FIG. 14 is a flowchart of style determination.
FIG. 15 is a diagram showing a form for displaying proofreading support information related to style.
FIG. 16 is a diagram showing a display of other proofreading support information.
FIG. 17 is a diagram illustrating a method for displaying calibration support information.
FIG. 18 is a diagram showing another method for displaying calibration support information.
[Explanation of symbols]
2 ... Conversion means
4 ... Kana character string storage
6. Phrase candidate storage unit
8 ... Autonomous dictionary
10 ... Attached word dictionary
14... Phrase generation means
16 ... Phrase candidate selection means
18 ... Proofreading support means
20 ... Display means

Claims (2)

与えられたかな文字列を、漢字を含む変換文字列に変換する文字列変換装置において、
かな文字列に対応付けて変換文字列およびその品詞を記憶した辞書と、
変換指令を受けると、前記辞書を参照して、与えられたかな文字列を、文節に区切って変換文字列に変換した変換文字列候補を品詞とともに文節候補記憶部に記録して出力し、変換文字列候補におけるいずれかの文節についての変換指令、後変換指令または文節区切りの変更指令を受けると、前記文節候補記憶部に記録された当該文節の変換文字列候補および品詞を新たな変換文字列候補および品詞に更新し、確定指令を受けて、選択された変換文字列候補を確定文字列として出力する変換手段と、
前記文節候補記憶部に記録された変換文字列候補における各文節の品詞に基づいて、校正支援のための出力を行う校正支援手段と、
を備えた文字列変換装置であって、
前記文節候補記憶部は、1つの文を構成するために与えられた全てのかな文字列が前記確定指令を受けるまで、変換文字列候補を品詞とともに保持しており、
前記校正支援手段は、1つの文を構成するために与えられた全てのかな文字列が前記確定指令を受ける前において、
前記文節候補記憶部に記録された変換文字列候補における各文節中の付属語が助詞であるか否かを判定し、同じ助詞を有する文節が所定回数以上連続するかどうかを計数し、所定回数以上連続する場合には、助詞が連続している旨の校正支援出力を行う処理を実行するものであり、
前記変換文字列候補におけるいずれかの文節についての変換指令、後変換指令または文節区切りの変更指令を受けると、変換後または変更後における文節に対して、未確定の文節だけでなく前記1つの文の中ですでに確定文字列として出力した文節も考慮して、前記校正支援出力を行う処理を再度実行すること、
を特徴とする文字列変換装置。
In a character string conversion device that converts a given kana character string into a conversion character string including kanji,
A dictionary that stores the converted character string and its part of speech in association with the kana character string;
When a conversion command is received , referring to the dictionary, the converted character string candidate obtained by dividing the given kana character string into a converted character string by dividing it into phrases is recorded in the phrase candidate storage unit together with the part of speech, and output . When a conversion command, a post-conversion command, or a phrase break change command is received for any of the clauses in the character string candidate, the conversion character string candidate and the part of speech of the clause recorded in the clause candidate storage unit are converted into a new conversion character string. Conversion means for updating the candidate and part of speech, receiving a confirmation command, and outputting the selected conversion character string candidate as a confirmed character string;
Proofreading support means for performing an output for proofreading support based on the part of speech of each phrase in the converted character string candidate recorded in the phrase candidate storage unit;
A character string conversion device comprising:
The phrase candidate storage unit holds conversion character string candidates together with parts of speech until all kana character strings given to form one sentence receive the confirmation command,
The proofreading support means, before all the kana character strings given to compose one sentence receive the confirmation command,
It is determined whether or not an adjunct in each phrase in the converted character string candidate recorded in the phrase candidate storage unit is a particle, and counts whether or not a phrase having the same particle continues for a predetermined number of times. or in the case of continuous is to execute the process intends rows proofreading output indicating that particle is continuous,
When a conversion command , a post-conversion command, or a phrase delimiter change command is received for any of the clauses in the conversion character string candidate, not only the undefined clause but also the one sentence for the post-conversion or post-change clause Taking into account the clause that has already been output as the confirmed character string, and executing the proofreading support output again,
Character string converter characterized by the above.
コンピュータを用いた文字列変換方法であって、
かな文字列に対応付けて変換文字列およびその品詞を予め辞書に記憶しておき、
変換指令を受けると、コンピュータの変換手段が、前記辞書を参照して、与えられたかな文字列を、文節に区切って変換文字列に変換した変換文字列候補を品詞とともに文節候補記憶部に記録して出力し、変換文字列候補におけるいずれかの文節についての変換指令、後変換指令または文節区切りの変更指令を受けると、前記文節候補記憶部に記録された当該文節の変換文字列候補および品詞を新たな変換文字列候補および品詞に更新し、確定指令を受けて、選択された変換文字列候補を確定文字列として出力する文字列変換方法において、
前記文節候補記憶部は、1つの文を構成するために与えられた全てのかな文字列が前記確定指令を受けるまで、変換文字列候補を品詞とともに保持しており、
コンピュータの校正支援手段が、1つの文を構成するために与えられた全てのかな文字列が前記確定指令を受ける前における校正支援処理として、
前記文節候補記憶部に記録された変換文字列候補における各文節中の付属語が助詞であるか否かを判定し、同じ助詞を有する文節が所定回数以上連続するかどうかを計数し、所定回数以上連続する場合には、助詞が連続している旨の校正支援出力を行う処理を実行するものであり、
前記変換文字列候補におけるいずれかの文節についての変換指令、後変換指令または文節区切りの変更指令を受けると、変換後または変更後における文節に対して、未確定の文節だけでなく前記1つの文の中ですでに確定文字列として出力した文節も考慮して、前記校正支援出力を行う処理を再度実行すること、
を特徴とする文字列変換方法。
A character string conversion method using a computer,
The conversion character string and its part of speech are stored in advance in the dictionary in association with the kana character string,
When the conversion command is received, the conversion means of the computer refers to the dictionary and records the converted character string candidate obtained by dividing the given character string into a converted character string by dividing it into a phrase, together with the part of speech, in the phrase candidate storage unit When the conversion command, post-conversion command, or phrase delimitation change command for any phrase in the conversion character string candidate is received, the conversion character string candidate and the part of speech of the phrase recorded in the phrase candidate storage unit In a character string conversion method for updating a new converted character string candidate and part of speech, receiving a confirmation command, and outputting the selected converted character string candidate as a confirmed character string,
The phrase candidate storage unit holds conversion character string candidates together with parts of speech until all kana character strings given to form one sentence receive the confirmation command,
As a proofreading support process before all the kana character strings given to compose one sentence receive the confirmation command, the proofreading support means of the computer,
It is determined whether or not an adjunct in each phrase in the converted character string candidate recorded in the phrase candidate storage unit is a particle, and counts whether or not a phrase having the same particle continues for a predetermined number of times. or in the case of continuous is to execute the process intends rows proofreading output indicating that particle is continuous,
When a conversion command , a post-conversion command, or a phrase delimiter change command is received for any of the clauses in the conversion character string candidate, not only the undefined clause but also the one sentence for the post-conversion or post-change clause Taking into account the clause that has already been output as the confirmed character string, and executing the proofreading support output again,
Character string conversion method characterized by
JP32516095A 1995-11-20 1995-11-20 Character string conversion apparatus and method having proofreading support function Expired - Fee Related JP4191805B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP32516095A JP4191805B2 (en) 1995-11-20 1995-11-20 Character string conversion apparatus and method having proofreading support function

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP32516095A JP4191805B2 (en) 1995-11-20 1995-11-20 Character string conversion apparatus and method having proofreading support function

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2005036285A Division JP2005135444A (en) 2005-02-14 2005-02-14 Character string conversion apparatus and method having proofreading support function

Publications (2)

Publication Number Publication Date
JPH09146953A JPH09146953A (en) 1997-06-06
JP4191805B2 true JP4191805B2 (en) 2008-12-03

Family

ID=18173696

Family Applications (1)

Application Number Title Priority Date Filing Date
JP32516095A Expired - Fee Related JP4191805B2 (en) 1995-11-20 1995-11-20 Character string conversion apparatus and method having proofreading support function

Country Status (1)

Country Link
JP (1) JP4191805B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6116014B2 (en) * 2014-11-07 2017-04-19 日本電信電話株式会社 Stylistic conversion device, method, and program

Also Published As

Publication number Publication date
JPH09146953A (en) 1997-06-06

Similar Documents

Publication Publication Date Title
WO2003065245A1 (en) Translating method, translated sentence outputting method, recording medium, program, and computer device
JP4191805B2 (en) Character string conversion apparatus and method having proofreading support function
JP2005135444A (en) Character string conversion apparatus and method having proofreading support function
Gakis et al. Design and implementation of an electronic lexicon for Modern Greek
JP2002123281A (en) Speech synthesizer
JP3033133B2 (en) Text editing device
JP2915225B2 (en) Document creation device
JPH01309179A (en) Natural language analyzing system
JPH0350668A (en) character processing device
JPH08161335A (en) Machine translation device
Hu Issues in the Study of Grammaticalization
Schweitzer et al. Prosody generation in the SmartKom project
JP2714238B2 (en) Character processor
JPS59103136A (en) Kana-kanji conversion processing device
JP2802369B2 (en) Kana-Kanji conversion device
Haralambous Arabic, Persian and Ottoman TEX for Mac and PC
JPS63106070A (en) Chinese sentence input system
JPH04295962A (en) Morpheme analyzing device
JP2000330998A (en) Pronouncing electronic dictionary
JPH07129566A (en) Kana-Kanji conversion processor
JP2896152B2 (en) Japanese text generation processor
JPH0414168A (en) Word processor
JPH04119469A (en) Dictionary preparation supporting device
JPH07210571A (en) Word search processing device and word search processing method
JPH04213754A (en) Sentence clause delimiter learning system

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20041015

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20041214

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050214

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051107

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051227

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060123

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060315

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060403

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060427

A911 Transfer of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20060605

A912 Removal of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20060616

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20080630

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080804

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080919

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110926

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110926

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140926

Year of fee payment: 6

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees