Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP7845704B2 - Character conversion support system and method for supporting character conversion of the character conversion support system - Google Patents
[go: Go Back, main page]

JP7845704B2 - Character conversion support system and method for supporting character conversion of the character conversion support system - Google Patents

Character conversion support system and method for supporting character conversion of the character conversion support system

Info

Publication number
JP7845704B2
JP7845704B2 JP2024131263A JP2024131263A JP7845704B2 JP 7845704 B2 JP7845704 B2 JP 7845704B2 JP 2024131263 A JP2024131263 A JP 2024131263A JP 2024131263 A JP2024131263 A JP 2024131263A JP 7845704 B2 JP7845704 B2 JP 7845704B2
Authority
JP
Japan
Prior art keywords
input
character
conversion
string
server device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2024131263A
Other languages
Japanese (ja)
Other versions
JP2026028656A (en
Inventor
禎治 豊
雅一 鈴置
清人 澁谷
智史 松澤
海友 鈴木
慎太郎 田中
耕太郎 清水
豊成 岩田
陽和 山本
達哉 増子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Blindx Lab
Original Assignee
Blindx Lab
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Blindx Lab filed Critical Blindx Lab
Priority to JP2024131263A priority Critical patent/JP7845704B2/en
Publication of JP2026028656A publication Critical patent/JP2026028656A/en
Application granted granted Critical
Publication of JP7845704B2 publication Critical patent/JP7845704B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Document Processing Apparatus (AREA)

Description

本発明は、所定の通信媒体を介して特定のドメインに接続可能なクライアント装置と、クライアント装置で起動するクライアントアプリケーションと、サーバ装置で起動するアプリケーションサーバとが連携する文字変換支援システムおよび文字変換支援システムの文字変換支援方法に関するものである。 This invention relates to a character conversion support system and a character conversion support method for a character conversion support system, comprising a client device capable of connecting to a specific domain via a predetermined communication medium, a client application launched on the client device, and an application server launched on a server device, all of which cooperate with each other.

従来、コンピュータシステムにおける文字情報処理は、OSの支配下において、辞書ライブラリを参照しながら入力されるキーコードを意図する文字情報に変換するFEP(フロントエンドプロセッサ)が組み込まれている。特に、文字処理におけるFEP(フロントエンドプロセッサ)は、日本語入力システムにおいて重要な役割を果たしている。 Traditionally, character information processing in computer systems has involved a Front-End Processor (FEP) that, under the control of the operating system, converts input key codes into intended character information while referencing a dictionary library. In particular, the FEP plays a crucial role in character processing within Japanese input systems.

FEPは、キーボードからの入力を受け取り、それをひらがなや漢字などの日本語文字に変換するプロセスを担当するが、このプロセスには、入力されたローマ字をひらがなに変換し、さらにユーザが選択するまでの候補の漢字や単語を提示すステップが含まれる。
上記に加えFEPの機能には候補単語の提示と選択機能、複数の入力メソッドのサポート(例:ローマ字入力、かな入力)機能が挙げられる。
The FEP (Front-End Processor) is responsible for receiving input from the keyboard and converting it into Japanese characters such as hiragana and kanji. This process includes steps such as converting the entered Roman letters to hiragana and then presenting candidate kanji or words for the user to select.
In addition to the above, FEP functions include suggesting and selecting candidate words, and supporting multiple input methods (e.g., Roman alphabet input, kana input).

一方で、FEPにはユーザが意図しない文字変換が行われる課題が存在する。これは特に技術用語や新しい言葉、外来語などの場合に顕著である。 On the other hand, FEPs (Front-End Processors) have a problem where unintended character conversions occur. This is particularly noticeable with technical terms, new words, and loanwords.

下記特許文献1には、「手元には限られた計算機リソースしかない場合でも、多様な文字を入力し表示できるようにするため、クライアント30のウェブブラウザは辞書センタ20のウェブサーバにアクセスし文字入力サービスを受ける。ウェブブラウザは文字の読みを入力し、辞書センタのウェブサーバはこれを文字コードに変換し、さらにフォントセンタ10のウェブサーバ上の画像ファイルのURLに変換する。この結果、文字の画像ファイルのURLをソースとして含むHTML文書がブラウザに送られ、ブラウザはURLに基づいてフォントセンタ10のウェブサーバから画像ファイルを取りだし、その取りだし画像を用いて文字を表示する。」ことが開示されている。 Patent Document 1, described below, discloses that, "To enable input and display of diverse characters even when limited computing resources are available, the web browser of client 30 accesses the web server of dictionary center 20 to receive a character input service. The web browser inputs the reading of the character, the dictionary center's web server converts this into a character code, and further converts it into a URL of an image file on the font center's web server 10. As a result, an HTML document containing the URL of the character's image file as the source is sent to the browser, the browser retrieves the image file from the font center's web server 10 based on the URL, and displays the character using the retrieved image."

また、下記特許文献2には、「インターネットを介して学習型サーバを利用して、音声ファイルをテキスト化すると共に話者の特定を行うため、音声認識システム1は、音声を入力する集音部2と、この音声から音声ファイルFを生成し、この音声ファイルFを文字変換サーバ及び話者特定サーバに送信し、文章ファイルWと話者Hの特定結果を受信する処理部3と、処理部3の処理結果を表示するモニタ部4から構成される。話者Hの発言と発言の間の無音状態により区切られた音声データVを音声ファイルFとして、インターネットを介して多数のユーザから収集されるデータを基に、自己学習によりデータ分析、解析を行うクラウドサービスである文字変換サーバ5及び話者特定サーバ6に送信する。そして、受信した文章ファイルW及び話者Hの特定結果を音声ファイルFに対応付けて、モニタ部4に時系列順に表示する。」ことが開示されている。 Furthermore, Patent Document 2 discloses that, "To convert audio files into text and identify speakers using a learning-type server via the Internet, the speech recognition system 1 consists of a sound collection unit 2 that inputs audio, a processing unit 3 that generates an audio file F from this audio, transmits this audio file F to a character conversion server and a speaker identification server, and receives a text file W and the speaker identification results, and a monitor unit 4 that displays the processing results of the processing unit 3. The audio data V, separated by silent periods between speaker H's statements, is sent as the audio file F to a character conversion server 5 and a speaker identification server 6, which are cloud services that perform data analysis and interpretation through self-learning based on data collected from numerous users via the Internet. The received text file W and the speaker identification results are then associated with the audio file F and displayed in chronological order on the monitor unit 4."

特開2001-350747号公報Japanese Patent Publication No. 2001-350747 特開2020-060735号公報Japanese Patent Publication No. 2020-060735

日本語を処理する文字変換処理システムにおいて、入力されるひらがなを漢字に変換する際、入力された文字列や音声、ジェスチャだけから完璧な文章を得ることは難しく、広い範囲で前後の文脈や、会話の状況を加味しないと、適切な表現が生成できないことは広く知られている。 In Japanese character conversion systems, it is widely known that obtaining a perfect sentence from input hiragana, audio, or gestures alone is difficult when converting hiragana to kanji. Appropriate expressions cannot be generated without considering a wide range of surrounding context and conversational situations.

特に、日本語のように、表意文字表現を前提とした同音多義語が多いと、「せんしゅがせんしゅをなおしました」という入力文に対しては、「船首が船首を直しました」あるいは「選手が選手を治しました」は文脈により、どちらとも解釈できてしまう。加えて、実運用ではそもそもの入力にタイプミスなど入力誤りが混じることも多い。 In particular, in languages like Japanese, which have many homophones and polysemous words based on ideographic characters, the input sentence "senshu ga senshu o naoshimashita" (the bow of the ship repaired the bow) can be interpreted as either "the player healed the player" or "the player treated the player," depending on the context. Furthermore, in actual use, input errors such as typos are often mixed in with the initial input.

例えば「せんしゅがせんしゅをなおしました」が、「船首が船首を直しました」と変換される場合と、「せんしゅうがせんしゅをなおしました」とタイプミスがある場合、「先週が船主を直しました」と変換されてしまう場合がある。このように、僅かな入力の違いで解釈(変換される文字列)が大きく変わってしまうことがある。 For example, if "senshu ga senshu o naoshimashita" (the captain repaired the captain) is entered as "senshu ga senshu o naoshimashita" (the bow repaired the bow), or if it's a typo and entered as "senshu ga senshu o naoshimashita" (the ship's bow repaired last week), it might be entered as "sanshuu no o naoshimashita" (last week repaired the ship's owner). As you can see, even slight differences in input can significantly alter the interpretation (the resulting string).

特に、クライアント装置から様々なユーザが特定のドメインに接続して、提供されるUI画面上で文字情報を入力する際、ユーザが意図する文字列に変換されない場合や、長文が入力された際に、文字変換処理に相当の時間を要してしまう場合が発生する課題がある。 In particular, when various users connect to a specific domain from client devices and input text information on the provided UI screen, there are issues such as the text not being converted to the intended string, or the text conversion process taking a considerable amount of time when long texts are entered.

本発明は、上記課題を解決し、クライアント装置のフロントエンドプロセッサの機能処理をネットワークに接続されるサーバ装置が備える変換文字列を推論する推論エンジンから取得する変換候補文字列を採用することで、クライアント装置を操作する同一のユーザが様々な文字処理環境において、入力デバイスの属性や、起動するアプリケーションの属性、起動するサービスの属性、文字情報の入力方式や入力スタイルが変化しても、入力した文字情報を確度の高い変換文字列候補を取得して出力することができる文字変換支援システムおよび文字変換支援システムの文字変換支援方法を提供することである。 The present invention solves the above problems and provides a character conversion support system and a character conversion support method for the character conversion support system. By employing conversion candidate strings obtained from an inference engine that infers conversion strings provided by a server device connected to the network, the functional processing of the client device's front-end processor can enable the same user operating the client device to obtain and output highly accurate conversion string candidates for input character information, even when the attributes of the input device, the attributes of the application being launched, the attributes of the service being launched, and the input method and style of character information change, in various character processing environments.

上記目的を達成する本発明の文字変換支援システムは以下に示す構成を備える。 The character conversion support system of the present invention, which achieves the above objective, has the following configuration.

本発明に係る文字変換支援システムは、所定の通信媒体を介して、文字列処理を行うフロントエンドプロセッサおよび入力部を有するクライアント装置と、前記フロントエンドプロセッサから文字列を取得するサーバ装置とが通信して、文字列変換処理を連携する文字変換支援システムであって、前記クライアント装置は、前記入力部によって入力される文字列およびユーザ情報を前記フロントエンドプロセッサが取得し、前記入力部から文字が入力されるたびに、これらを前記サーバ装置に逐次転送し、前記サーバ装置は、前記転送のたびに、前記ユーザ情報および前記入力部から逐次入力される文字列を含む入力履歴に基づいて文脈を特定し、過去に入力された文の先頭部分まで巻き戻して当該文脈を再評価し、当該再評価結果に基づいて大規模言語モデルを用いる複数の推論エンジンのいずれかによりリアルタイムに変換処理を実行し、特定された文脈および前記入力部から逐次入力される文字列を反映して生成された変換文字列候補を応答として前記クライアント装置に返送し、前記クライアント装置は、前記返送された変換文字列候補を表示する処理を行う構成を備えることを特徴とする。 The character conversion support system according to the present invention is a character conversion support system in which a client device having a front-end processor and an input unit for string processing and a server device that acquires strings from the front- end processor communicate via a predetermined communication medium to coordinate string conversion processing, wherein the client device has a configuration in which the front-end processor acquires strings and user information input by the input unit, and sequentially transfers these to the server device each time characters are input from the input unit, and each time the transfer occurs, the server device identifies the context based on the input history including the user information and the strings sequentially input from the input unit, re-evaluates the context by rewinding to the beginning of previously input sentences, performs conversion processing in real time using one of a plurality of inference engines using a large-scale language model based on the re-evaluation result, and returns a converted string candidate generated reflecting the identified context and the strings sequentially input from the input unit as a response to the client device, and the client device performs processing to display the returned converted string candidate .

本発明によれば、クライアント装置のフロントエンドプロセッサの機能処理をネットワークに接続されるサーバ装置が備える変換文字列を推論する推論エンジンから取得する変換候補文字列を採用することで、クライアント装置を操作する同一のユーザが様々な文字処理環境において、入力デバイスの属性や、起動するアプリケーションの属性、起動するサービスの属性、文字情報の入力方式や入力スタイルが変化しても、入力した文字情報を確度の高い変換文字列候補を取得して出力することができる。 According to the present invention, by employing conversion candidate strings obtained from an inference engine that infers conversion strings provided by a server device connected to the network, the client device's front-end processor can obtain and output highly accurate conversion string candidates for the input character information, even when the attributes of the input device, the attributes of the application being launched, the attributes of the service being launched, and the input method and style of the character information change, the same user operating the client device can do so in various character processing environments.

図面は、本発明の特定の実施の形態を示し、発明の不可欠な構成ばかりでなく、選択的及び好ましい実施の形態を含む。
本実施形態を示す文字変換支援システムの構成を説明するブロック図。 図1に示した文字変換支援システムのハードウエア資源を前提とするソフトウエアの機能を説明するブロック図。 図1に示したサーバ装置のハードウエア構成を説明するブロック図。 図1に示したクライアント装置のハードウエア資源とソフトウエアの機能を説明するブロック図。 本実施形態を示す文字変換支援システムの文字変換支援方法の一例を示すフローチャート。 本実施形態を示す文字変換支援システムの文字変換支援方法の一例を示すフローチャート。
The drawings illustrate specific embodiments of the present invention, including not only essential components of the invention but also optional and preferred embodiments.
A block diagram illustrating the configuration of the character conversion support system shown in this embodiment. A block diagram illustrating the software functions of the character conversion support system shown in Figure 1, assuming the hardware resources available. A block diagram illustrating the hardware configuration of the server device shown in Figure 1. A block diagram illustrating the hardware resources and software functions of the client device shown in Figure 1. A flowchart showing an example of a character conversion support method for the character conversion support system of this embodiment. A flowchart showing an example of a character conversion support method for the character conversion support system of this embodiment.

次に本発明を実施するための最良の形態について図面を参照して説明する。 Next, the best mode for carrying out the present invention will be described with reference to the drawings.

<システム構成の説明>
〔第1実施形態〕
図1は、本実施形態を示す文字変換支援システムの構成を説明するブロック図である。なお、本例は、所定の通信媒体を介して特定のドメインに接続可能なクライアント装置CL1~CLNと、クライアント装置CL1~CLNで起動するクライアントアプリケーション100と、サーバ装置1で起動するアプリケーションサーバ11とが連携して文字変換処理を支援する文字変換支援システムを例とする。
<System Configuration Description>
[First Embodiment]
Figure 1 is a block diagram illustrating the configuration of the character conversion support system shown in this embodiment. This example describes a character conversion support system in which client devices CL1 to CLN, which can connect to a specific domain via a predetermined communication medium, a client application 100 launched on client devices CL1 to CLN, and an application server 11 launched on server device 1 cooperate to support character conversion processing.

図1において、1はサーバ装置で、ネットワーク21を介して、クライアント装置CL1~CLNと所定のプロトコルで通信する。 In Figure 1, 1 is a server device that communicates with client devices CL1 to CLN via network 21 using a predetermined protocol.

サーバ装置1において、11はアプリケーションサーバで、ネットワーク21を介してクライアント装置CL1~CLNのクライアントアプリケーションと通信する。12はドメイン知識サーバ選択部(DKS)で、クライアント装置CL1~CLNの入力部103が入力する情報を所定の言語に基づいて文字変換処理を行うフロントエンドプロセッサ(FEP)102から受け取るユーザ情報、サービス情報(一意に割当られたサービス番号(Universal Unique IDentifier))、アプリケーション情報、文書プロパティ等を受け取る。そして、DKS12は、知識サーバ群13から文字変換処理における第2の推論処理を行う1つの候補を選択する処理を実行する。 In server device 1, 11 is an application server that communicates with client applications on client devices CL1 to CLN via the network 21. 12 is a Domain Knowledge Server Selection Unit (DKS) that receives user information, service information (uniquely assigned service number (Universal Unique Identifier)), application information, document properties, etc., from the front-end processor (FEP) 102, which performs character conversion processing based on a predetermined language, using information input by the input unit 103 of client devices CL1 to CLN. The DKS 12 then executes a process to select one candidate from the knowledge server group 13 for the second inference processing in the character conversion process.

50はドメインネームサーバ(DNS)で、クライアント装置CL1~CLNの入力部103から入力されるドメイン名に対応するIPアドレスを提供する。 50 is a Domain Name Server (DNS) that provides IP addresses corresponding to domain names entered from the input sections 103 of client devices CL1 to CLN.

クライアント装置CL1~CLNは、ネットワーク22を介して、DNS50が指定するIPアドレス(xxx.xxx.xxx)に従ってルーティングされる特定のURL1~URLNに接続する。特定のURL1~URLNは、幅広いジャンルがあり、それぞれのURLに相応しい会話やチャットを行う場合、特定の用語が選択される確率があり、相互の会話で利用される文字列には一定の傾向があることが分かっている。 Client devices CL1 to CLN connect to specific URLs 1 to URLN via network 22, routed according to the IP address (xxx.xxx.xxx) specified by DNS 50. These specific URLs 1 to URLN cover a wide range of genres, and it has been observed that when engaging in conversations or chats appropriate to each URL, specific terminology is likely to be selected, and there are certain trends in the strings used in mutual conversations.

なお、本実施形態では、クライアント装置CL1~CLNのユーザが入力部103から入力するドメイン名に適応して、FEP102がバックグラウンドでサーバ装置1へ文字情報を推論する第2の推論処理を依頼する。 In this embodiment, the FEP 102 requests a second inference process from the server device 1 in the background to infer character information, based on the domain name entered by the user of client devices CL1 to CLN from the input unit 103.

図2は、図1に示した文字変換支援システムのハードウエア資源を前提とするソフトウエアの機能を説明するブロック図であり、図1と同一のものには同じ符号を付してある。 Figure 2 is a block diagram illustrating the software functions of the character conversion support system shown in Figure 1, assuming the hardware resources of the system. Components identical to those in Figure 1 are denoted by the same reference numerals.

図2において、サーバ装置1が備える複数の第2の推論部13-1~13-Nは、複数の知識サーバ13-1-1~13-1-Nおよびプロファイル13-2-1~13-2-Nを備える。 In Figure 2, the server device 1 comprises multiple second inference units 13-1 to 13-N, each including multiple knowledge servers 13-1-1 to 13-1-N and profiles 13-2-1 to 13-2-N.

クライアント装置CL1~CLNにおいて、101は切替部で、文字変換時にローカルで第1の推論処理を実行するか、文字変換時にサーバ装置1側による第1の推論処理を実行するかを入力部103が入力する情報(ドメイン名が含まれる)に基づいて切替える処理を実行する。 In client devices CL1 to CLN, the switching unit 101 performs a process to switch between executing the first inference process locally during character conversion or executing the first inference process on the server device 1 side during character conversion, based on the information (including the domain name) input by the input unit 103.

FEP102は、第1の推論部102-1と、ユーザプロファイル情報(ユーザ辞書を含む)を保持する保持部102-2を備える。なお、保持部102-2は、サーバ装置1に転送されるユーザ情報を保持可能に構成される。本実施形態において、ユーザ情報には、ユーザが使用する文字処理態様として、前記ユーザが使用する文書のプロパティ、前記ユーザが使用しているサービスの属性、前記ユーザが使用しているアプリケーションの属性が含まれる構成としている。また、保持部102-2に保持されるユーザ情報は、ユーザが入力する文字列の使用環境に適応して更新可能に保持している。 The FEP 102 comprises a first inference unit 102-1 and a storage unit 102-2 that holds user profile information (including a user dictionary). The storage unit 102-2 is configured to hold user information to be transferred to the server device 1. In this embodiment, the user information includes the properties of the document used by the user, the attributes of the service used by the user, and the attributes of the application used by the user, as characteristics of the character processing used by the user. Furthermore, the user information held in the storage unit 102-2 is maintained in a way that allows it to be updated in accordance with the user's input environment.

図3は、図1に示したサーバ装置1のハードウエア構成を説明するブロック図である。なお、図1または図2と同一のものには同じ符号を付している。 Figure 3 is a block diagram illustrating the hardware configuration of the server device 1 shown in Figure 1. Components identical to those in Figure 1 or Figure 2 are denoted by the same reference numerals.

図3において、31は通信部で、ネットワーク21に接続されるクライアント装置CL1~CLNと所定のプロトコルで相互に通信する機能処理を実行する。 In Figure 3, 31 is the communication unit, which performs functional processing to communicate with client devices CL1 to CLN connected to the network 21 using a predetermined protocol.

32はCPUで、外部メモリ33に記憶されるアプリケーションサーバ11(オペレーティングシステムを含む各種のアプリケーションプログラム)をRAM36に展開して実行する。 32 is the CPU, which loads the application server 11 (various application programs, including the operating system) stored in external memory 33 into RAM 36 and executes it.

34は推論エンジン部で、第2の推論部13-1~13-Nが展開されている。なお、第2の推論部13-1~13-Nは、ユーザが関わる社会領域の自然言語の文章や使い方(コーパス)を常に大規模に収集・更新していて、文字変換候補の合致度が進化するように維持されている。 34 is the inference engine unit, where the second inference units 13-1 to 13-N are deployed. These second inference units 13-1 to 13-N constantly collect and update large-scale natural language texts and usage examples (corpora) from the social domains the user interacts with, maintaining an evolving degree of matching for character conversion candidates.

36-1はDKS部で、ネットワーク21を介して、CPU32が推論エンジン部34から選択する知識サーバ13-1-1~13-1-Nのいずれかにより推論された変換文字列候補をクライアント装置CL1~CLNのいずれかのFEP102に引き渡す機能処理を実行する。なお、当該機能処理は、クライアント装置CL1~CLNを操作するユーザが入力部310により文字列を入力している間、常時継続されている。 36-1 is the DKS unit, which performs a function to transfer conversion string candidates, inferred by one of the knowledge servers 13-1-1 to 13-1-N selected by the CPU 32 from the inference engine unit 34, to the FEP 102 of one of the client devices CL1 to CLN via the network 21. This function is continuously performed while the user operating client devices CL1 to CLN is inputting strings via the input unit 310.

39はAI支援部で、大規模言語モデル(LLM)を膨大なテキストデータと高度なディープラーニング技術を用いて構築された、自然言語処理(NLP:Neural Language Processing)と呼ばれる分野における革新的な文字変換処理を支援する処理を実行する。
なお、大規模言語モデルには、T5(Text-to-Text Transfer Transformer)が使用される。アーキテクチャをもとにした派生モデルが数々提案されている。T5は2017年に発表されたTransformerの系列であり、ひらがなのテキストを入力し、それを漢字に変換したテキストを出力するタスクとして、T5はこれを学習する。
Unit 39, located in the AI Support Department, executes processes that support innovative character conversion in the field of Natural Language Processing (NLP), which involves building large-scale language models (LLMs) using vast amounts of text data and advanced deep learning techniques.
For large-scale language models, T5 (Text-to-Text Transformer Transformer) is used. Numerous derived models based on this architecture have been proposed. T5 is a series of Transformers announced in 2017, and it learns by taking hiragana text as input and outputting text converted to kanji.

なお、サーバ装置1が備える知識サーバ群13の推論エンジンは、AI支援部39と協働して、クライアント装置CL1~CLNから逐次取得するかな文字に対する変換文字列候補の確度を向上させる処理が実行されている。 Furthermore, the inference engine of the knowledge server group 13, which is equipped with server device 1, works in cooperation with the AI support unit 39 to perform processing that improves the accuracy of conversion string candidates for kana characters acquired sequentially from client devices CL1 to CLN.

また、AI支援部39の機能処理を推論エンジン内に組み込む構成としてもよい。 Alternatively, the functional processing of the AI support unit 39 may be integrated into the inference engine.

LLMの学習は、ひらがな文を入力として、対応する漢字文の集合(コーパス)を教師として与える「教師あり学習」を行う。すなわち、ひらがな文を入力に与えて上記T5の出力を計算し、教師の漢字文と比較して損失(ロス)を求める。この損失に基づき、モデルの各パラメータの勾配にしたがってパラメータを更新する。 LLM learning uses "supervised learning," where hiragana sentences are used as input and a corresponding set of kanji sentences (corpus) is provided as training data. Specifically, the output of T5 (as described above) is calculated by inputting hiragana sentences and comparing it to the training kanji sentences to determine the loss. Based on this loss, the model parameters are updated according to the gradient of each parameter.

推論エンジンは言語コミュニティごとにコーパスをもつ。例えばフォーマルな場面では新聞や雑誌、本で使われる文章を、カジュアルな場面では会話文やSNSのテキストが用いられる。 The inference engine has a corpus for each language community. For example, in formal settings, it uses texts from newspapers, magazines, and books, while in casual settings, it uses conversational texts and social media texts.

コーパスは常に最新に更新される。つまり推論エンジンはユーザの履歴から学習するのではなく、ユーザの属する社会全体から学習する。推論エンジンはそのために常に広く情報を収集し、かな漢字交じり文から形態素解析で対応するひらがな文を自動で取得した上でもとの文と合わせて「かな文と漢字文のペア」を作成し続ける。このペアを大量に集め追加・更新することで学習を深化させる。 The corpus is constantly updated. This means the inference engine doesn't learn from the user's history, but from the entire society to which the user belongs. To achieve this, the inference engine continuously collects a wide range of information, automatically extracting the corresponding hiragana sentences from mixed kana and kanji texts through morphological analysis, and then combining them with the original text to create "kana-kanji sentence pairs." By collecting, adding, and updating a large number of these pairs, the learning process is deepened.

図4は、図1に示したクライアント装置CL1~CLNのハードウエア資源とソフトウエアの機能を説明するブロック図である。なお、図1と同一のものには同じ符号を付してある。なお、クライアント装置CL1~CLNは、各種のデータ端末が想定され、PADデバイス、パーソナルコンピュータ(PC)、スマートフォンが含まれる。 Figure 4 is a block diagram illustrating the hardware resources and software functions of client devices CL1 to CLN shown in Figure 1. Components identical to those in Figure 1 are denoted by the same reference numerals. Client devices CL1 to CLN are assumed to represent various data terminals, including PAD devices, personal computers (PCs), and smartphones.

また、本実施形態において、FEP102は、かな文字変換モードが選択中、CPU301は、通信部304を介して、入力部310から入力されるキーコードをネットワーク21に接続されるサーバ装置1のDKS12にキーコード情報およびユーザ情報(詳細は後述する)を転送する。 Furthermore, in this embodiment, when the kana character conversion mode is selected, the FEP 102, via the communication unit 304, transfers the key code information and user information (details will be described later) to the DKS 12 of the server device 1 connected to the network 21, along with the key code input from the input unit 310.

DKS12は、クライアント装置CL1~CLNのいずれかから、引き渡されたキーコード情報およびユーザ情報に従い、変換候補文字列を確定するための第2の推論部13-1~13-Nを選択し、いずれかの第2の推論部が変換した漢字混じりの日本語の文字列データは、応答部36-2が通信部31を介して、要求元のクライアント装置CL1~CLNのFEP102に応答する。 The DKS12 selects a second inference unit 13-1 to 13-N to determine a conversion candidate string based on the key code information and user information received from one of the client devices CL1 to CLN. The response unit 36-2 then sends the converted Japanese string data containing kanji characters to the FEP 102 of the requesting client device CL1 to CLN via the communication unit 31.

この際、FEP102は、あたかも自ら変換した文字列候補として、ブラウザがディスプレイ311の表示画面の文字入力ラインにサーバ装置1側で変換された文字列候補を出力するように制御される。 In this case, the FEP 102 is controlled so that the browser outputs the converted string candidates from the server device 1 to the character input line on the display screen of the display 311, as if they were string candidates converted by the server device 1 itself.

この際、サーバ装置1は、クライアント装置CL1~CLNを操作するユーザのTPO(「TPO」の「T」は「Time(時間)」、「P」は「Place(場所)」、「O」は「Occasion(場面)」の頭文字)に合わせて、自在に第2の推論部13-1~13-Nのいずれかが選択されたり、変換中であっても、他の第2の推論部による文字列変換処理が機動的に切り替えられたりする。 In this process, the server device 1 can freely select one of the second inference units 13-1 to 13-N according to the TPO (Time, Place, and Occasion) of the user operating the client devices CL1 to CLN. Even during conversion, the server device 1 can flexibly switch to another second inference unit performing string conversion.

また、DKS12は、クライアント装置CL1~CLNを操作するユーザが入力した、例えば日本語が丁寧語であるか、SNSで利用される特別な文言(通常のフォーマルな文書には使用しない文字列)、例えば「ばずり(バズり)」とかを認識して、変換中であっても、他の第2の推論部による文字列変換処理が機動的に切り替えられたりすることが可能に構成されている。 Furthermore, DKS12 is configured to recognize, for example, whether the input from the user operating client devices CL1 to CLN is polite Japanese, or special phrases used on social networking services (strings not typically used in formal documents), such as "buzz" (ばずり), and to allow for the dynamic switching of string conversion processing by a second inference unit even while conversion is in progress.

図4において、301はCPUで、ROM302に記憶されるBIOSを起動して、入力出力デバイスのI/Oを制御するとともに、RAM303に展開される各種のアプリケーションを実行することで、各種のデータ処理を実行する。 In Figure 4, 301 is the CPU, which starts the BIOS stored in ROM 302, controls the I/O of input and output devices, and executes various data processing operations by running various applications loaded into RAM 303.

304は通信部で、ネットワーク21を介してサーバ装置1と所定のプロトコルで通信して、各種のデータ処理をネットワーク環境で行う。 304 is the communications unit, which communicates with the server device 1 via the network 21 using a predetermined protocol and performs various data processing in the network environment.

311はディスプレイで、入力部310が入力するかな文字情報がサーバ装置1に引き渡され、サーバ装置1の第2の推論部13-1~13-Nで生成される変換文字列候補を連続的に受け取りカーソルで指定される位置に文字情報が配列されるように表示される。 311 is a display. The kana character information entered by the input unit 310 is passed to the server device 1. The server device 1's second inference units 13-1 to 13-N continuously receive conversion string candidates, and the character information is displayed so that it is arranged at the position specified by the cursor.

なお、ユーザは、入力部310を操作している間、サーバ装置1から変換候補文字列を受け取り続けるが、ユーザが表示される変換文字列を訂正するようなアクションを実行すると、サーバ装置1は、さらに最適な第2の変換処理を担う知識サーバ13-1-1~13-1-Nのいずれかを選択する。 Furthermore, while the user operates the input unit 310, they continue to receive conversion candidate strings from the server device 1. If the user performs an action to correct the displayed conversion string, the server device 1 selects one of the knowledge servers 13-1-1 to 13-1-N to handle the most optimal second conversion process.

〔サーバ装置側のデータ処理〕
図5は、本実施形態を示す文字変換支援システムの文字変換支援方法の一例を示すフローチャートである。なお、(1)~(9)は、図1に示したサーバ装置1側のデータ処理であって、CPU32が外部メモリ33に記憶された制御プログラムをRAM36上に展開して処理することにより実現される。
[Data processing on the server side]
Figure 5 is a flowchart showing an example of a character conversion support method for the character conversion support system in this embodiment. Note that (1) to (9) are data processing on the server device 1 side shown in Figure 1, which is realized by the CPU 32 loading the control program stored in the external memory 33 onto the RAM 36 and processing it.

まず、CPU32は、図1に示したクライアント装置CL1~CLNのいずれかのFEP102から取得するユーザ情報(ドメイン情報を含む)および入力部310から入力されるかな文字情報を取得する(1)。 First, the CPU 32 acquires user information (including domain information) from the FEP 102 of one of the client devices CL1 to CLN shown in Figure 1, and kana character information input from the input unit 310 (1).

CPU32は、図1に示したクライアント装置CL1~CLNから取得したかな文字情報およびユーザ情報をDKS12に引き渡すと(2)、DKS12は、取得したドメイン情報に基づいて知識サーバ13-1-1~13-1-Nのいずれかを選択する(3)。 The CPU 32 passes the kana character information and user information obtained from the client devices CL1 to CLN shown in Figure 1 to the DKS 12 (2). The DKS 12 then selects one of the knowledge servers 13-1-1 to 13-1-N based on the acquired domain information (3).

次に、CPU32は、ネットワーク21を介して選択された知識サーバが変換した文字列候補をクライアント装置CL1~CLNのいずれかのFEP102に引き渡す(4)。 Next, the CPU 32 passes the string candidate converted by the selected knowledge server via the network 21 to one of the FEP 102s of client devices CL1 to CLN (4).

次に、CPU32は、クライアント装置CL1~CLNのいずれかのFEP102から引き渡した変換文字列候補に対する修正指示または再変換指示を受け付けているかどうかを判断し(5)、CPU32が修正指示または再変換指示を受け付けていると判断した場合、さらに、CPU32は、引き続きステップ(3)で選択したいずれかの知識サーバを選択するかどうかを判断し(6)、CPU32は、同じ知識サーバを選択しないと判断した場合、さらに、CPU32はDKS12を制御して、知識サーバ13-1-1~13-1-Nのいずれかを選択する(7)。そして、CPU32は、処理をステップ(4)へ戻す。 Next, the CPU 32 determines whether it has received a correction or re-conversion instruction for the conversion string candidate passed from the FEP 102 of any of the client devices CL1 to CLN (5). If the CPU 32 determines that it has received a correction or re-conversion instruction, it then determines whether it should continue to select one of the knowledge servers selected in step (3) (6). If the CPU 32 determines that it will not select the same knowledge server, it then controls the DKS 12 to select one of the knowledge servers 13-1-1 to 13-1-N (7). The CPU 32 then returns the process to step (4).

一方、ステップ(6)で、CPU32は、引き続きステップ(3)で選択した同一の知識サーバ13-1-1~13-1-Nのいずれかを選択すると判断した場合、ステップ(4)へ戻る。 On the other hand, if in step (6) the CPU 32 determines to continue selecting one of the same knowledge servers 13-1-1 to 13-1-N selected in step (3), it returns to step (4).

一方、ステップ(5)で、CPU32は、クライアント装置CL1~CLNのいずれかのFEP102から引き渡した変換文字列候補に対する修正指示または再変換指示が一定時間経過したら(8)、図1に示したクライアント装置CL1~CLNのいずれかのFEP102から取得するユーザ情報(ドメイン情報を含む)および入力部310から入力されるテキスト情報を取得していない状態が継続しているかどうか、すなわち、クライアント装置CL1~CLNのいずれかのFEP102からかな文字情報を受け付けているかどうかを判断する(9)。 On the other hand, in step (5), if a certain amount of time has elapsed since the correction or re-conversion instruction for the conversion string candidate passed from the FEP 102 of any of the client devices CL1 to CLN (8), the CPU 32 determines whether it has continued not to acquire user information (including domain information) from any of the FEP 102 of the client devices CL1 to CLN shown in Figure 1, and whether it has not received text information from the input unit 310, that is, whether it has received kana character information from any of the FEP 102 of the client devices CL1 to CLN (9).

ここで、CPU32は、クライアント装置CL1~CLNのいずれかのFEP102からかな文字情報を受け付けていると判断した場合、ステップ(2)へ戻り、同様の処理を繰り返す。一方、ステップ(9)で、CPU32は、クライアント装置CL1~CLNのいずれかのFEP102からかな文字情報を受け付けていないと判断した場合、本処理を終了する。 At this point, if the CPU 32 determines that it has received kana character information from one of the FEP 102s of client devices CL1 to CLN, it returns to step (2) and repeats the same process. On the other hand, if in step (9) the CPU 32 determines that it has not received kana character information from one of the FEP 102s of client devices CL1 to CLN, it terminates this process.

〔クライアント装置CL1~CLN側のデータ処理〕
図6は、本実施形態を示す文字変換支援システムの文字変換支援方法の一例を示すフローチャートである。なお、(11)~(19)は、図1に示したクライアント装置CL1~CLN側のデータ処理であって、CPU301が図示しない外部メモリに記憶された制御プログラムをRAM303上に展開して処理することにより実現される。
[Data processing on client devices CL1 to CLN]
Figure 6 is a flowchart showing an example of a character conversion support method for the character conversion support system illustrating this embodiment. Note that (11) to (19) are data processing on the client device CL1 to CLN side shown in Figure 1, which is realized by the CPU 301 loading a control program stored in an external memory (not shown) onto the RAM 303 and processing it.

まず、クライアント装置CL1~CLNを操作する各ユーザは、いずれかのドメインへのアクセスを指示する際、CPU301は、図示しない外部メモリからブラウザを起動する(11)。その際、各ユーザは、入力部310のキーボードを操作してかな文字列を、例えばローマ字変換方式で入力すると(12)、FEP102は、逐次入力されるかな文字列をサーバ装置1に出力する(13)。 First, when each user operating client devices CL1 to CLN instructs access to any of the domains, the CPU 301 launches a browser from external memory (not shown) (11). At that time, each user operates the keyboard on the input unit 310 to input kana characters, for example, using a Romanization method (12), and the FEP 102 outputs the sequentially input kana characters to the server device 1 (13).

この際、FEP102は、保持部102-2に保持されるユーザ情報(ユーザが使用している文書プロパティ、ユーザが使用しているサービス、ユーザが使用しているアプリケーション)を検知して(14)、サーバ装置1に検知したユーザ情報を転送する(15)。 At this point, the FEP 102 detects user information (document properties used by the user, services used by the user, applications used by the user) held in the holding unit 102-2 (14), and transfers the detected user information to the server device 1 (15).

次に、CPU301は、サーバ装置1が選択した知識サーバ(第2の推論部13-1~13-Nのいずれか1つの第2の推論部)からネットワーク21を介して取得する変換文字列候補を取得したら(16)、ディスプレイ311のブラウザが指定している文字列入力ライン(カーソル指示されている)に変換文字列を表示する(17)。 Next, the CPU 301 obtains a candidate for the converted string from the knowledge server selected by the server device 1 (one of the second inference units 13-1 to 13-N) via the network 21 (16), and then displays the converted string on the string input line (indicated by the cursor) specified by the browser on the display 311 (17).

次に、CPU301は、各ユーザはディスプレイ311のブラウザ上に表示された変換文字列を訂正、修正、削除等の編集指示がなされているかどうかを判断し(18)、編集指示がなされていると判断した場合、ステップ(13)に戻る。 Next, the CPU 301 determines whether each user has given an editing instruction, such as correcting, modifying, or deleting the converted string displayed on the browser of the display 311 (18). If it determines that an editing instruction has been given, it returns to step (13).

一方、ステップ(18)で、CPU301は、編集指示がなされていないと判断した場合、さらに入力部310からかな文字が入力されているかどうかを判断し(19)、CPU301は、文字コードが入力されていないと判断した場合、サーバ装置1による文字列候補の取得処理を終了し、文字コードが入力されると判断した場合、ステップ(13)に戻り、同様の処理を繰り返す。 On the other hand, if the CPU 301 determines in step (18) that no editing instruction has been given, it further determines whether kana characters have been entered from the input unit 310 (19). If the CPU 301 determines that no character code has been entered, it terminates the process of acquiring string candidates by the server device 1. If it determines that a character code has been entered, it returns to step (13) and repeats the same process.

〔第1実施形態の効果〕
本実施形態によれば、クライアント装置CL1~CLNのフロントエンドプロセッサ102の機能処理をネットワーク21に接続されるサーバ装置1が備える変換文字列を推論する複数の推論エンジン(LLMを利用する推論エンジン)から取得する変換候補文字列を採用することで、クライアント装置CL1~CLNを操作する同一のユーザが様々な文字処理環境において、入力デバイスの属性や、起動するアプリケーションの属性、起動するサービスの属性、文字情報の入力方式や入力スタイルが変化しても、入力した文字情報を確度の高い変換文字列候補を取得して出力することができる。
[Effects of the First Embodiment]
According to this embodiment, the functional processing of the front-end processor 102 of client devices CL1 to CLN is performed using conversion candidate strings obtained from multiple inference engines (inference engines utilizing LLM) that infer conversion strings provided by the server device 1 connected to the network 21. This allows the same user operating client devices CL1 to CLN to obtain and output highly accurate conversion string candidates for the input character information, even when the attributes of the input device, the attributes of the application being launched, the attributes of the service being launched, and the input method and style of the character information change in various character processing environments.

なお、上記サーバ装置1側が提供する文字列変換候補を提示する無償サービスを一般ユーザ向けに展開するか、特定のユーザ向けにカスタマイズ機能を付加して有償サービスとして展開するかはシステム運用者が自在に選択できるものとする。 Furthermore, the system operator may freely choose whether to offer the free service of providing string conversion candidates provided by the server device 1 to general users, or to offer it as a paid service with customized functions for specific users.

また、上記システムでは、言語モデルとして日本語を例としたが、言語モデルの言語は、主要な外国語モデルを対象とすることも可能である。
さらに、言語が異なるユーザ間において、チャット等相互に文字情報を交換する環境においては、翻訳モデル支援するシステムを介在させて、同様の文字列変換処理を行える環境も自在に構築可能である。
Furthermore, while the system described above uses Japanese as an example of a language model, it is also possible to target major foreign language models for the language model.
Furthermore, in environments where users of different languages exchange text information, such as through chat, it is possible to freely construct an environment where similar string conversion processing can be performed by using a system that supports translation models.

〔第2実施形態〕
上記実施形態では、クライアント装置CL1~CLNから短文が入力される場合を想定した例を説明したが、当然に長い文脈であっても本発明を適用することができる。
[Second Embodiment]
In the above embodiment, an example was described assuming that short sentences are input from client devices CL1 to CLN, but of course, the present invention can also be applied to longer contexts.

上記システムにおいて、サーバ装置1が長い文脈を解釈すると変換精度と引き換えに、変換可視までの応答速度が遅れることが想定される。 In the system described above, it is anticipated that when server device 1 interprets a long context, the response speed until the conversion is visible will be delayed, at the expense of conversion accuracy.

そこで、クライアント装置CL1~CLNを操作するユーザが入力部310から入力される1文字(1トークン)を読み込むたびに、ネットワーク21を介してFEP102がサーバ装置1の第2の推論部13-1~13-Nへ即座に入力された文字コードおよび文字列変換要求を送付する。 Therefore, each time a user operating client devices CL1 to CLN reads a single character (one token) input from the input unit 310, the FEP 102 immediately sends the input character code and string conversion request to the second inference units 13-1 to 13-N of the server device 1 via the network 21.

このようにして、サーバ装置1が文字コードおよび文字列変換要求を受け取ると、第2の推論部13-1~13-Nが文字列への変換処理と生成した文字列を示す文字コードをクライアント装置CL1~CLNに応答する。 In this way, when server device 1 receives a character code and string conversion request, the second inference units 13-1 to 13-N process the conversion to a string and respond to client devices CL1 to CLN with a character code indicating the generated string.

この際、サーバ装置1は、毎回文書のパラグラフ(翻訳単位)の先頭まで巻き戻ってから開始するように文字列変換処理を制御する。 In this process, server device 1 controls the string conversion process to rewind to the beginning of each paragraph (translation unit) of the document before starting.

このため、パラグラフの先頭部分は、何度も繰り返し文字列への変換処理が実行される(リワインド)こととなるが、変換のたびに入力文字は長くなっているので変換精度が向上することが期待される。 Therefore, the beginning of each paragraph will undergo repeated string conversion (rewinding), but since the input characters become longer with each conversion, improved conversion accuracy is expected.

これにより、クライアント装置CL1~CLNは、最初は誤変換されていた単語も入力が進むにつれて、自動的に巻き戻って適切に修正されているように変換文字列が表示される。 As a result, client devices CL1 through CLN will display converted strings that automatically correct any initially mistranslated words as input progresses, ensuring proper correction.

このような変換処理によれば、クライアント装置CL1~CLN側の文字入力処理が速い場合、サーバ装置1側の文字列推論、変換処理の負担が増加してしまうので、サーバ装置1は、各ユーザ当たり、実行中の文字列変換処理が終了するまで続いてくる要求を一旦記憶部に保留させておくように制御する。 With this type of conversion process, if the character input processing on client devices CL1 to CLN is fast, the burden on the string inference and conversion processing on server device 1 increases. Therefore, server device 1 controls the system to temporarily hold requests from each user in storage until the ongoing string conversion process is completed.

そして、次の処理を開始するにあたって、保留したい要求を逐次実行させるのではなく、要求の最後の1個だけを実行し、それ以前に保留された要求を削除する制御を実行する。 Then, when starting the next process, instead of executing the pending requests sequentially, the system executes only the last request and deletes the previously pending requests.

〔第2実施形態の効果〕
これにより、クライアント装置CL1~CLN側からは、サーバ装置1が並列に1文字ずつ変換しているように見えているにもかかわらず、サーバ装置1側では、ユーザ当たりスレッドは1つで済むこととなる。
[Effects of the second embodiment]
As a result, although it appears to client devices CL1 to CLN that server device 1 is converting one character at a time in parallel, server device 1 only needs one thread per user.

また、クライアント装置CL1~CLN側は、長文に対する文字列変換処理の結果をサーバ装置1からとびとびに取得するので、クライアント装置CL1~CLN側は、最後にサーバ装置1に送信した文字列から新しく追加されたひらがな文字列を最後に変換された文章の末尾に連結されるように表示が制御される。 Furthermore, since client devices CL1 to CLN intermittently retrieve the results of the string conversion process for long texts from server device 1, the display of client devices CL1 to CLN is controlled so that newly added hiragana strings from the last string sent to server device 1 are concatenated to the end of the last converted text.

こうすることで、長いチャンクの推認処理において、サーバ装置1の変換レイテンシがあったとしても、クライアント装置CL1~CLN側のディスプレイ311の画面上では、CPU301は、ひらがな入力が後追いで遅延なく自動的に適切な文章に変換されているように表示を制御する。 By doing this, even if there is conversion latency in the server device 1 during the long chunk inference process, the CPU 301 controls the display on the client device CL1-CLN's display 311 so that the hiragana input is automatically converted to the appropriate text without delay.

なお、巻き戻し処理は、一般にはパラグラフ単位で行われるが、最小で文単位、最大は処理中の文書全体の間で、サーバ装置1側の付加状態に基づいて調整されることとなる。 Note that while rewind processing is generally performed on a paragraph basis, it can be adjusted from a minimum of one sentence to a maximum of the entire document being processed, based on the additional status on the server device 1.

〔第3実施形態〕
上記実施形態では、クライアント装置CL1~CLNから短文が入力される場合を想定した例を説明したが、クライアント装置CL1~CLNのディスプレイ311において、変換処理がすでに完了した変換済の文字列等であっても、後から再変換処理を制御する構成としてもよい。
[Third Embodiment]
In the above embodiment, an example was described assuming that short text is input from client devices CL1 to CLN. However, the display 311 of client devices CL1 to CLN may be configured to control the re-conversion process even if the conversion process has already been completed for the converted string, etc.

上述の通り、種々の文字列変換処理を実行したとしても、どうしても文脈的に誤解釈が残る場合が想定される。 As mentioned above, even after performing various string conversion processes, it is still possible that contextual misinterpretations may remain.

この場合、クライアント装置CL1~CLNを操作する各ユーザは、推論の途中結果を利用できるように文字列変換処理の態様を制御することにより、推論の途中結果を最大限利用してユーザによる文字列入力処理の負担を軽減できるように制御する構成を上記システムに組み入れてもよい。 In this case, the system may incorporate a configuration that controls the string conversion process so that each user operating client devices CL1 to CLN can utilize the intermediate results of the inference, thereby maximizing the use of the intermediate results and reducing the burden of string input processing on the user.

具体的には、サーバ装置1において、第2の推論部13-1~13-Nは、図示しないメモリ資源上に変換用のバッファを確保しており、当該バッファ上に現在のパラグラフ変換前のすべての平文(各ユーザが入力した生のひらがな文字列やフリックの軌跡)をバッファリングしているので、変換確定後であっても巻き戻す(いわゆるアンドゥする)ことが可能に構成されている。 Specifically, in server device 1, the second inference units 13-1 to 13-N secure a conversion buffer on memory resources (not shown), and buffer all the plaintext (raw hiragana characters entered by each user and the trajectory of flick gestures) before the current paragraph conversion on this buffer. Therefore, it is configured to allow undoing (rewinding) even after the conversion has been confirmed.

そこで、サーバ装置1において、第2の推論部13-1~13-Nは、文節ごとに、推論結果の信頼度(0.0~1.0(確率表記))を保持しており、この信頼度に応じて生成文書の一部をハイライトするようにクライアント装置CL1~CLNのFEP102に指示を与える。 Therefore, in server device 1, the second inference units 13-1 to 13-N maintain a confidence level (0.0 to 1.0 (probability notation)) for each phrase of the inference result, and instruct the FEP 102 of client devices CL1 to CLN to highlight a portion of the generated document according to this confidence level.

〔第3実施形態の効果〕
これにより、クライアント装置CL1~CLNの各ユーザは、ディスプレイ311上の画面上で修正箇所を素早く判断できるようになり、そこに戻り文節単位で選択的に変換前の状態に戻した上で、適切な修正作業に移行させることが可能となる。
[Effects of the third embodiment]
This allows each user of client devices CL1 to CLN to quickly identify the areas to be corrected on the screen of display 311, return to that point, selectively revert to the pre-conversion state on a phrase-by-phrase basis, and then proceed to the appropriate correction work.

このため、単純なかな漢字変換とは異なり、本実施形態によれば、たとえ文字変換処理が確定した後であっても前に巻き戻って編集作業を行うことができるため、巻き戻しにあたっての各ユーザの心理的負担は少なくなる。 Therefore, unlike simple kana-kanji conversion, this embodiment allows users to rewind and perform editing even after the character conversion process has been finalized, thus reducing the psychological burden on each user when rewinding.

なお、上記信頼度に応じたハイライト機能は、必須ではなくて、各ユーザが画面上のカーソルを操作した際に、該当する文節だけを巻き戻って選択的に変換前の文字列のみを表示する制御を実行してもよい。 Furthermore, the highlighting function based on the confidence level mentioned above is not mandatory. Alternatively, when a user manipulates the cursor on the screen, the system may implement a control that rewinds only the relevant phrase and selectively displays only the original, unconverted string.

また、サーバ装置1における第2の推論部13-1~13-Nによる文字列変換の推論処理には、単純な入力ミスであったり、もとの文章や会話の表現自体が不十分であったりする場合も想定される。 Furthermore, the string conversion inference process performed by the second inference units 13-1 to 13-N in server device 1 may involve simple input errors or insufficient expression in the original text or conversation.

そこで、たとえ間違った部分の「てにをは」のみを修正した場合であっても、パラグラフ単位で再評価を行えるように制御することで、1つの修正の推定の確度向上が他の部分へ波及して、周囲の文章も自動的に校正することが可能となる。 Therefore, even if only a single incorrect particle is corrected, controlling the system to re-evaluate the entire paragraph allows the improved accuracy of the correction to ripple through to other parts, automatically proofreading the surrounding text.

〔第4実施形態〕
上記実施形態では、クライアント装置CL1~CLNから短文が入力される場合を想定した例を説明したが、各ユーザが入力部310からキー入力する際、ユーザ入力の前段のタイプミスやノイズ除去などのクレンジングのために、クライアント装置CL1~CLN側に軽量の第1の推論部102-1を設けることで、柔軟に対処できるように構成してもよい。
[Fourth Embodiment]
In the above embodiment, an example was described assuming that short sentences are input from client devices CL1 to CLN. However, when each user inputs text from the input unit 310, a lightweight first inference unit 102-1 may be provided on the client devices CL1 to CLN to flexibly handle the situation, such as removing typos and noise before the user input.

このように、サーバ装置1による文字列変換の推論処理のみに依存することなく、クライアント装置CL1~CLN側の第1の推論部102-1がサーバ装置1側の推論処理と連携することで、各ユーザに特有のキー入力の誤入力を排除して、第2の推論部13-1~13-Nに推論を妨げるユーザ固有に起因した文字列をサーバ装置1に転送してしまうことを制限し、第2の推論部13-1~13-Nにおける推論処理が汚染されてしまうことを回避して、サーバ装置1から高精度な文字列変換処理結果を得ることが可能となる。 In this way, instead of relying solely on the string conversion inference processing by the server device 1, the first inference unit 102-1 on the client devices CL1 to CLN cooperates with the inference processing on the server device 1. This eliminates user-specific key input errors, restricts the transfer of user-specific strings that interfere with inference to the second inference units 13-1 to 13-N to the server device 1, and prevents contamination of the inference processing in the second inference units 13-1 to 13-N, thereby enabling the acquisition of highly accurate string conversion processing results from the server device 1.

〔第4実施形態の効果〕
この際、クライアント装置CL1~CLN側のローカルな第1の推論部102-1は、入力部310がキーボードを想定した場合、ローマ字変換された文字列を対象とするのではなく、キーストローク自体の情報を直接取得して各ユーザ固有の所定の推論処理を適応させることでより、精度の高い文字列を抽出して、サーバ装置1側での推論処理に反映させることが可能となる。
[Effects of the fourth embodiment]
In this case, the local first inference unit 102-1 on the client device CL1 to CLN side, assuming the input unit 310 is a keyboard, does not target the Romanized string but directly acquires information about the keystroke itself and applies a predetermined inference process specific to each user, thereby enabling it to extract a more accurate string and reflect it in the inference process on the server device 1 side.

このように、文字入力モードがキーボードによる直接入力と、フリック入力とを選択的に切り替え可能な場合、それぞれ入力モードに合わせて第2の推論部13-1~13-Nを選択することで、入力モード毎に文字列変換精度の向上が期待できる。 Thus, when the text input mode can be selectively switched between direct keyboard input and flick input, by selecting the second inference units 13-1 to 13-N according to the respective input mode, an improvement in string conversion accuracy can be expected for each input mode.

〔第4実施形態の効果〕
上記実施形態では、クライアント装置CL1~CLNから短文が入力される場合を想定した例を説明したが、各ユーザが入力部310からキー入力する際、ユーザ入力の前段のタイプミスやノイズ除去などのクレンジングのために、クライアント装置CL1~CLN側に軽量の第1の推論部102-1を設けることで、柔軟に対処できるように構成してもよい。
[Effects of the fourth embodiment]
In the above embodiment, an example was described assuming that short sentences are input from client devices CL1 to CLN. However, when each user inputs text from the input unit 310, a lightweight first inference unit 102-1 may be provided on the client devices CL1 to CLN to flexibly handle the situation, such as removing typos and noise before the user input.

なお、第1の推論部102-1は、クライアント装置CL1~CLN側にユーザ毎に確保し、専用の個人辞書メモリを備えるものとする。 Furthermore, the first inference unit 102-1 is reserved for each user on the client device CL1 to CLN side and is equipped with a dedicated personal dictionary memory.

〔第5実施形態〕
上記実施形態では、クライアント装置CL1~CLNから短文が入力部310のキーボードから入力される場合を想定した例を説明したが、特に、キータッチは、各個人それなりに、指先の動きや、打下す指先の速度に個人差があり、例えばローマ字入力特有の入力の揺れやタイプミスの頻度を計測して学習して、文字列変換候補に反映させる制御を実行することで、変換確度の向上が期待できる。
[Fifth Embodiment]
In the above embodiment, an example was described assuming that short sentences are entered from the keyboard of the input unit 310 from client devices CL1 to CLN. In particular, there are individual differences in the movement of fingertips and the speed at which fingertips strike keys. For example, by measuring and learning the frequency of input fluctuations and typos specific to Roman alphabet input and implementing control that reflects this in the string conversion candidates, it is possible to improve the conversion accuracy.

特に、「ぃ」の入力に、「xi」を入力するユーザと、「li」を入力するユーザでは、キー入力タイプの特性が変わるので、「船員」と「船員n」とがいずれも「船員」と変換文字列候補を出力させるように制御する。 In particular, since the characteristics of the key input type differ between users who input "i" using "xi" and those who input "li," the system is controlled so that both "seaman" and "seaman n" output "seaman" as the conversion string candidate.

〔第5実施形態の効果〕
本実施形態によれば、サーバ装置1側におけるLLMを利用する第2の推論部13-1~13-Nにおいて、大きな誤生成を引き起こしかねないような入力文字列を前もって修正することができる。
[Effects of the Fifth Embodiment]
According to this embodiment, in the second inference units 13-1 to 13-N that utilize LLM on the server device 1 side, input strings that could cause significant errors in generation can be corrected in advance.

また、文字列をフリック入力する入力部310を採用するクライアント装置CL1~CLNにおいては、配置するかな文字に対するタッチミスに固有の誤りを修正することも可能となる。 Furthermore, in client devices CL1 to CLN that employ an input unit 310 for flick input of text strings, it becomes possible to correct errors specific to touch mistakes in the placement of kana characters.

〔第6実施形態〕
本実施形態では、クライアント装置CL1~CLNにおいて、キーボードを採用する場合において、キーストロークの時間間隔と文節(トークン)の区切りの相関関係を利用してキーストロークの間隔の長さがある閾値を超えた場合に、以下の処理を実行するように制御してもよい。
[Sixth Embodiment]
In this embodiment, when a keyboard is used in client devices CL1 to CLN, the correlation between the time interval of keystrokes and the delimiter of phrases (tokens) may be used to control the system so that when the length of the keystroke interval exceeds a certain threshold, the following processing is executed.

具体的には、サーバ装置1において、クライアント装置CL1~CLNの各ユーザがキーボードを利用する場合、キーストロークの間隔の長さがある閾値を超えた場合に、隠れたデリミネータ(区切り子)を挿入する制御を実行する。 Specifically, in server device 1, when each user of client devices CL1 to CLN uses the keyboard, if the length of the keystroke interval exceeds a certain threshold, a control mechanism is executed to insert a hidden delimiter.

〔第6実施形態の効果〕
本実施形態によれば、ユーザ入力では、エコーされないが、内部で文字列を文節に分解される際、上記区切り子を挿入しておくことにより、長い文章をまとめて行う変換で発生し易い「は」、「へ」などの接続詞を跨いだ文節区切りの間違いから派生するドミノ倒し的な誤解釈の連鎖を抑制することができる。
なお、上記文字入力が音声入力でも同様の事象が予定されるため、同様の対処により、同様の効果が期待できる。
[Effects of the sixth embodiment]
According to this embodiment, although user input is not echoed, by inserting the above-mentioned delimiter when the string is internally broken down into phrases, it is possible to suppress a chain reaction of misinterpretations that arises from errors in phrase division that span conjunctions such as "wa" and "e," which are likely to occur when converting long sentences all at once.
Furthermore, the same issue is expected to occur with voice input as well, so the same countermeasures can be expected to have the same effect.

〔第7実施形態〕
本実施形態では、クライアント装置CL1~CLNにおいて、同一のユーザが使用するアプリケーションサービスが複数存在する場合に、同一のユーザであっても、入力傾向が替わることが予想されるので、サーバ装置1側におけるLLMを利用する第2の推論部13-1~13-Nのうち、上位となる第2の推論部を利用するように選択順位を切り替える制御を実行するように構成してもよい。
[Seventh Embodiment]
In this embodiment, if there are multiple application services used by the same user in client devices CL1 to CLN, it is expected that the input tendencies will change even for the same user. Therefore, the server device 1 may be configured to perform control to switch the selection order among the second inference units 13-1 to 13-N that utilize LLM, so as to use the higher-ranking second inference unit.

具体的には、例えば同一のユーザが、業務用途で文字入力を実行する場合、対象の文書名と、冒頭からパラグラフを変換した過程での文字列を選定するように第2の推論部13-1~13-Nのうち、上位となる第2の推論部を利用するように選択順位を切り替える制御するものとする。 Specifically, for example, when the same user performs text input for business purposes, the system will control the selection order so that it uses the highest-ranking second inference unit among the second inference units 13-1 to 13-N to select the target document name and the strings obtained during the process of converting from the beginning to the paragraphs.

〔第7実施形態の効果〕
本実施形態によれば、クライアント装置CL1~CLNを操作する各ユーザからみると、同じ文書作成ソフトウエアや、表計算ソフトウエアから同じインタフェースで文書を作成していながら、実行中のアプリケーションの種別状況に応じた自然な文章を生成することが期待できる。加えて、外部情報の検索を組み合わせるRAGを採用する場合、文書化する過程でいったんAIチャットを介する必要もなくなり、利便性が向上する。
ここで、RAGとは、Retrieval-Augmented Generationの略称で、検索拡張生成を意味する。
[Effects of the 7th Embodiment]
According to this embodiment, from the perspective of each user operating client devices CL1 to CLN, it is expected that natural-sounding text will be generated according to the type of application being run, even though they are creating documents using the same interface from the same document creation software or spreadsheet software. In addition, when RAG, which combines external information retrieval, is adopted, it becomes unnecessary to go through AI chat during the document creation process, improving convenience.
Here, RAG is an abbreviation for Retrievable-Augmented Generation, which means search augmented generation.

一方、会話・SNS用途であれば、会話を跨いだ長い変換文字列推論処理が可能となり、同時にライフログをとることで固有名詞の変換精度を上げることが可能となる。 On the other hand, for conversation and social media use, it becomes possible to perform long string inference processing across conversations, and simultaneously improve the accuracy of proper noun conversion by recording life logs.

また、クライアントアプリケーション100が会話相手の文章を提供することで、直前の相手やグループの会話文も文字列変換の推論に含めることも可能となる。これにより、特に、会話・SNSアプリケーションで、1つの文章が短いために頻発する誤解釈による誤爆を効率的に抑制することが期待できる。 Furthermore, by having the client application 100 provide the conversation partner's text, it becomes possible to include the previous conversation text from the previous partner or group in the string conversion inference. This is expected to effectively suppress misinterpretations and accidental messages, which frequently occur in conversation and social networking applications due to the short length of individual messages.

なお、文字変換支援システムでは、サーバ装置1における第2の推論部13-1~13-Nと、クライアント装置CL1~CLNにおける第1の推論部102-1との機能を明確に分離し、サーバ装置1側では、ユーザ固有のユーザ情報(タイプ上の癖に由来する情報)を取得して履歴を管理する必要がなく、個人の属性に紐づく情報(個人のプロファイル)がサーバ装置1から流出してしまうことを回避することができるように構成している。 Furthermore, in the character conversion support system, the functions of the second inference units 13-1 to 13-N in server device 1 and the first inference unit 102-1 in client devices CL1 to CLN are clearly separated. This configuration eliminates the need for server device 1 to acquire user-specific user information (information derived from typing habits) and manage its history, thus preventing information linked to individual attributes (individual profiles) from leaking from server device 1.

また、ビジネス上の目的からクライアント装置CL1~CLNの各ユーザの行動履歴を参照する必要がある場合、これとは独立にストリクトなアカウント管理機能をシステムに組み込むことも可能である。
なお、個人の属性に紐づく情報は、タイピングの癖などの低レベルの統計情報に限られ、これらは個人のクライアント装置CL1~CLN側のみ保持し、サーバ装置1が知る必要がないように制御することが可能である。
Furthermore, if it is necessary to refer to the activity history of each user of client devices CL1 to CLN for business purposes, it is also possible to incorporate a strict account management function into the system independently of this.
Furthermore, information linked to individual attributes is limited to low-level statistical information such as typing habits, and this information is stored only on the individual's client devices CL1 to CLN, and can be controlled so that server device 1 does not need to know about it.

さらに、本実施形態において、サーバ装置1で変換される文字列候補を出力する出力部は、表示部に限らず、変換文字列候補を各言語の音声情報として出力するデバイス(スピーカー、マイク付きイヤホン、ゴーグルデバイス等)であってもよい。 Furthermore, in this embodiment, the output unit that outputs the string candidates converted by the server device 1 is not limited to a display unit, but may also be a device that outputs the converted string candidates as audio information in each language (speaker, earphone with microphone, goggle device, etc.).

本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステムまたは装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサがプログラム(上述した図5、図6に示すフローチャートに準拠するプログラム)を読み出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えばASIC)によっても実現可能である。 The present invention can also be realized by supplying a program that implements one or more of the functions of the above-described embodiments to a system or device via a network or storage medium, and by having one or more processors in the computer of that system or device read and execute the program (a program conforming to the flowcharts shown in Figures 5 and 6 above). Furthermore, it can also be realized by a circuit (e.g., an ASIC) that implements one or more functions.

以上の記載した本発明に関する開示は、少なくとも下記事項に要約することができる。 The disclosures relating to the present invention described above can be summarized to at least the following:

(1)所定の通信媒体を介して、文字列処理を行うフロントエンドプロセッサおよび入力部を有するクライアント装置と、前記フロントエンドプロセッサから文字列を取得するサーバ装置とが通信して、文字列変換処理を連携する文字変換支援システムであって、前記クライアント装置は、前記入力部によって入力される文字列およびユーザ情報を前記フロントエンドプロセッサが取得し、前記入力部から文字が入力されるたびに、これらを前記サーバ装置に逐次転送し、前記サーバ装置は、前記転送のたびに、前記ユーザ情報および前記入力部から逐次入力される文字列を含む入力履歴に基づいて文脈を特定し、過去に入力された文の先頭部分まで巻き戻して当該文脈を再評価し、当該再評価結果に基づいて大規模言語モデルを用いる複数の推論エンジンのいずれかによりリアルタイムに変換処理を実行し、特定された文脈および前記入力部から逐次入力される文字列を反映して生成された変換文字列候補を応答として前記クライアント装置に返送し、前記クライアント装置は、前記返送された変換文字列候補を表示する処理を行う構成を備えることを特徴とする。 (1) A character conversion support system in which a client device having a front-end processor and an input unit for string processing and a server device that acquires strings from the front-end processor communicate via a predetermined communication medium to coordinate string conversion processing, wherein the client device has a configuration in which the front-end processor acquires strings and user information input by the input unit, and sequentially transfers these to the server device each time characters are input from the input unit, and each time the transfer occurs, the server device identifies the context based on the input history including the user information and the strings sequentially input from the input unit, re-evaluates the context by rewinding to the beginning of previously input sentences, performs conversion processing in real time using one of a plurality of inference engines using a large-scale language model based on the re-evaluation result, and returns a candidate converted string that reflects the identified context and the strings sequentially input from the input unit as a response to the client device, and the client device performs processing to display the returned candidate converted string .

前記入力部によって入力される文字列は、キーボード入力またはフリック入力により行うことを特徴とする。 ( 2 ) The string entered by the input unit is characterized by being entered by keyboard input or flick input.

)前記サーバ装置は、前記ユーザ情報に含まれる文字処理態様に基づいて複数の推論エンジンの中からいずれか1つの推論エンジンを選択する構成を備えることを特徴とする。 ( 3 ) The server device is characterized by having a configuration that selects one of a plurality of inference engines based on the character processing pattern included in the user information.

)前記ユーザ情報に含まれる文字処理態様は、前記ユーザが使用する文書のプロパティ、前記ユーザが使用しているサービスの属性、前記ユーザが使用しているアプリケーションの属性を含むことを特徴とする。 ( 4 ) The character processing methods included in the user information are characterized by including the properties of the document used by the user, the attributes of the service used by the user, and the attributes of the application used by the user.

)所定の通信媒体を介して、文字列処理を行うフロントエンドプロセッサおよび入力部を有するクライアント装置と、前記フロントエンドプロセッサから文字列を取得するサーバ装置とが通信して、文字列変換処理を連携する文字変換支援方法であって、記クライアント装置において前記入力部によって入力される文字列およびユーザ情報を前記フロントエンドプロセッサが取得し、前記入力部から文字が入力されるたびに、これらを前記サーバ装置に逐次転送し、前記サーバ装置において、前記転送のたびに、前記ユーザ情報および前記入力部から逐次入力される文字列を含む入力履歴に基づいて文脈を特定し、過去に入力された文の先頭部分まで巻き戻して当該文脈を再評価し、当該再評価結果に基づいて大規模言語モデルを用いる複数の推論エンジンのいずれかによりリアルタイムに変換処理を実行し、特定された文脈および前記入力部から逐次入力される文字列を反映して生成された変換文字列候補を応答として前記クライアント装置に返送し、前記クライアント装置において、前記返送された変換文字列候補を表示する処理を行うことを特徴とする。 ( 5 ) A character conversion support method in which a client device having a front-end processor and an input unit for string processing and a server device that acquires a string from the front-end processor communicate via a predetermined communication medium to coordinate string conversion processing, characterized in that, in the client device, the front - end processor acquires a string and user information input by the input unit, and sequentially transfers these to the server device each time a character is input from the input unit, and in the server device, each time a transfer occurs, identifies a context based on the input history including the user information and the string sequentially input from the input unit, rewinds to the beginning of a previously input sentence and re-evaluates the context, executes a conversion process in real time using one of a plurality of inference engines using a large-scale language model based on the re-evaluation result, returns a candidate converted string generated reflecting the identified context and the string sequentially input from the input unit as a response to the client device, and performs a process in the client device to display the returned candidate converted string .

なお、上記システムでは、クライアント装置CL1~CLNにインストールされているFEP102にキーコードを引き渡すことで言語変換処理を開始する例を説明したが、自然言語処理分野で主に事前処理として用いられる手法であり、対象となる言語の文法や単語の品詞情報をもとに、文章を形態素(単語が意味を持つ最小の単位)に分解する解析手段、例えばmecabを組み入れたシステムとして構築することも可能である。 The above system example describes a method where language conversion processing is initiated by passing a key code to FEP102 installed on client devices CL1 to CLN. However, this is a technique primarily used as preprocessing in the field of natural language processing. It is also possible to construct a system incorporating an analysis tool, such as mecab, that decomposes text into morphemes (the smallest units in which a word has meaning) based on the grammar and part-of-speech information of the target language.

また、サーバ装置1側の複数の第2の推論部13-1~13-Nは、それぞれ独自に、または相互に連携して変換した文字列と、修正度合を学習することで、様々なユーザに対して、それぞれのユーザに特化して要求する特定の文字列に変換するので、ユーザ固有の表現にも適応した変換文字列候補や多才な変換候補をタイムリーに提示するように進化させることが可能である。 Furthermore, the multiple second inference units 13-1 to 13-N on the server device 1 learn the converted strings and their degree of modification, either independently or in coordination with each other. This allows them to convert strings to specific strings tailored to each user's requirements, enabling them to evolve to present a timely array of conversion string candidates adapted to user-specific expressions and a wide range of versatile conversion candidates.

さらに、クライアント装置CL1~CLNで有効な言語種別は、セットアップされているので、サーバ装置1側の複数の第2の推論部13-1~13-Nに使用言語別に配置させることで、クライアント装置間で利用する言語が異なる場合にも、ワールドワイドな翻訳機能処理を組み入れたシステムとして構築することも可能である。 Furthermore, since the language types valid in client devices CL1 to CLN are already set up, it is possible to configure a system with worldwide translation processing capabilities even when different languages are used between client devices by arranging the multiple second inference units 13-1 to 13-N on the server device 1 side according to the language used.

また、打ち間違え自動修正機能、OS特有の言語処理機能、自動変換トリガー機能、個人の利用環境にカスタマイズさせる機能、コンテキスト認識機能、モードレス機能、DNNを独自に進化させる機能を適切なタイミングで拡張することで、さらにユーザの利便性を向上させることが可能である。 Furthermore, by appropriately expanding features such as automatic typographical error correction, OS-specific language processing, automatic conversion triggers, customization options for individual user environments, context recognition, modeless functionality, and the ability to independently evolve the DNN, user convenience can be further improved.

1 サーバ装置
CL1~CLN クライアント装置
21 ネットワーク
50 DNS

1. Server devices CL1-CLN, Client device 21, Network 50, DNS

Claims (5)

所定の通信媒体を介して、文字列処理を行うフロントエンドプロセッサおよび入力部を有するクライアント装置と、前記フロントエンドプロセッサから文字列を取得するサーバ装置とが通信して、文字列変換処理を連携する文字変換支援システムであって、
前記クライアント装置は、
前記入力部によって入力される文字列およびユーザ情報を前記フロントエンドプロセッサが取得し、
前記入力部から文字が入力されるたびに、これらを前記サーバ装置に逐次転送し、
前記サーバ装置は、
前記転送のたびに、前記ユーザ情報および前記入力部から逐次入力される文字列を含む入力履歴に基づいて文脈を特定し、
過去に入力された文の先頭部分まで巻き戻して当該文脈を再評価し、
当該再評価結果に基づいて大規模言語モデルを用いる複数の推論エンジンのいずれかによりリアルタイムに変換処理を実行し、
特定された文脈および前記入力部から逐次入力される文字列を反映して生成された変換文字列候補を応答として前記クライアント装置に返送し、
前記クライアント装置は、前記返送された変換文字列候補を表示する処理を行う構成を備えることを特徴とする文字変換支援システム。
A character conversion support system in which a client device having a front-end processor and input unit for character processing and a server device that acquires character strings from the front-end processor communicate via a predetermined communication medium to coordinate character conversion processing,
The aforementioned client device
The front-end processor acquires the string and user information input by the input unit.
Each time a character is input from the input unit, these characters are sequentially transferred to the server device.
The server device is
Each time the aforementioned transfer is performed, the context is identified based on the user information and the input history, which includes strings sequentially entered from the input unit.
Rewind to the beginning of the previously entered text and re-evaluate the context.
Based on the re-evaluation results, the conversion process is performed in real time using one of several inference engines that employ large-scale language models.
The system returns a candidate for a converted string, generated in accordance with the identified context and the strings sequentially input from the input unit, to the client device as a response.
The character conversion support system is characterized by having a client device that performs processing to display the returned conversion string candidates .
前記入力部によって入力される文字列は、キーボード入力またはフリック入力により行うことを特徴とする請求項に記載の文字変換支援システム。 The character conversion support system according to claim 1 , characterized in that the character string entered by the input unit is entered by keyboard input or flick input. 前記サーバ装置は、
前記ユーザ情報に含まれる文字処理態様に基づいて複数の推論エンジンの中からいずれか1つの推論エンジンを選択する構成を備えることを特徴とする請求項に記載の文字変換支援システム。
The server device is
The character conversion support system according to claim 1 , characterized in that it includes a configuration to select one inference engine from among a plurality of inference engines based on the character processing method included in the user information.
前記ユーザ情報に含まれる文字処理態様は、前記ユーザが使用する文書のプロパティ、前記ユーザが使用しているサービスの属性、前記ユーザが使用しているアプリケーションの属性を含むことを特徴とする請求項に記載の文字変換支援システム。 The character processing method included in the user information is characterized in that it includes the properties of the document used by the user, the attributes of the service used by the user, and the attributes of the application used by the user, as described in claim 1 . 所定の通信媒体を介して、文字列処理を行うフロントエンドプロセッサおよび入力部を有するクライアント装置と、前記フロントエンドプロセッサから文字列を取得するサーバ装置とが通信して、文字列変換処理を連携する文字変換支援方法であって、
記クライアント装置において
前記入力部によって入力される文字列およびユーザ情報を前記フロントエンドプロセッサが取得し、
前記入力部から文字が入力されるたびに、これらを前記サーバ装置に逐次転送し、
前記サーバ装置において、
前記転送のたびに、前記ユーザ情報および前記入力部から逐次入力される文字列を含む入力履歴に基づいて文脈を特定し、
過去に入力された文の先頭部分まで巻き戻して当該文脈を再評価し、
当該再評価結果に基づいて大規模言語モデルを用いる複数の推論エンジンのいずれかによりリアルタイムに変換処理を実行し、
特定された文脈および前記入力部から逐次入力される文字列を反映して生成された変換文字列候補を応答として前記クライアント装置に返送し、
前記クライアント装置において、
前記返送された変換文字列候補を表示する処理を行うことを特徴とする文字変換支援方法。
A character conversion support method in which a client device having a front-end processor and input unit for character processing and a server device that acquires a character from the front-end processor communicate via a predetermined communication medium to coordinate character conversion processing,
In the aforementioned client device,
The front-end processor acquires the string and user information input by the input unit.
Each time a character is input from the input unit, these characters are sequentially transferred to the server device.
In the aforementioned server device,
Each time the aforementioned transfer is performed, the context is identified based on the user information and the input history, which includes strings sequentially entered from the input unit.
Rewind to the beginning of the previously entered text and re-evaluate the context.
Based on the re-evaluation results, the conversion process is performed in real time using one of several inference engines that employ large-scale language models.
The system returns a candidate for a converted string, generated in accordance with the identified context and the strings sequentially input from the input unit, to the client device as a response.
In the aforementioned client device,
A character conversion support method characterized by performing a process to display the returned conversion string candidates .
JP2024131263A 2024-08-07 2024-08-07 Character conversion support system and method for supporting character conversion of the character conversion support system Active JP7845704B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2024131263A JP7845704B2 (en) 2024-08-07 2024-08-07 Character conversion support system and method for supporting character conversion of the character conversion support system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2024131263A JP7845704B2 (en) 2024-08-07 2024-08-07 Character conversion support system and method for supporting character conversion of the character conversion support system

Publications (2)

Publication Number Publication Date
JP2026028656A JP2026028656A (en) 2026-02-20
JP7845704B2 true JP7845704B2 (en) 2026-04-14

Family

ID=98785192

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2024131263A Active JP7845704B2 (en) 2024-08-07 2024-08-07 Character conversion support system and method for supporting character conversion of the character conversion support system

Country Status (1)

Country Link
JP (1) JP7845704B2 (en)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011215911A (en) 2010-03-31 2011-10-27 Ntt Docomo Inc Communication device, communication system, and character string conversion method

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011215911A (en) 2010-03-31 2011-10-27 Ntt Docomo Inc Communication device, communication system, and character string conversion method

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
GPT-4で日本語入力システムを作ってみた,Qiita,2023年12月10日,[online] [検索日2025.10.14] <URL: https://qiita.com/y_koj/items/213e76850475c8b3fe98>
かんなマニュアル Version 3.2,1994年04月25日,pp.18-20,105,[online] [検索日2025.10.14] <URL: https://web.archive.org/web/20160528013350/http://www.nec.co.jp/canna/docs/cannadoc.pdf>

Also Published As

Publication number Publication date
JP2026028656A (en) 2026-02-20

Similar Documents

Publication Publication Date Title
JP7346609B2 (en) Systems and methods for performing semantic exploration using natural language understanding (NLU) frameworks
US20220215183A1 (en) Automatic post-editing model for neural machine translation
JP5166661B2 (en) Method and apparatus for executing a plan based dialog
CN100483416C (en) Character input method, input method system and method for updating word stock
US8250455B2 (en) Assisting document creation
US8886521B2 (en) System and method of dictation for a speech recognition command system
US8612206B2 (en) Transliterating semitic languages including diacritics
US8538757B2 (en) System and method of a list commands utility for a speech recognition command system
US7912700B2 (en) Context based word prediction
CN101203849B (en) Predicted Transformation for User Input
JP7335300B2 (en) Knowledge pre-trained model training method, apparatus and electronic equipment
US9251137B2 (en) Method of text type-ahead
JP2022540784A (en) Derivation of Multiple Semantic Representations for Utterances in Natural Language Understanding Frameworks
US20070225969A1 (en) Method and Apparatus for Dynamic Modification of Command Weights in a Natural Language Understanding System
JP2001249920A (en) Method and system for providing candidate for text from inference input source
WO2009049049A1 (en) Method and system for adaptive transliteration
CN110968245B (en) An operating method for controlling office software through voice
JP2001101185A (en) Machine translation method and device capable of automatically switching dictionaries and program storage medium with program for executing such machine translation method stored therein
EP2329489A1 (en) Stochastic phoneme and accent generation using accent class
US7630880B2 (en) Japanese virtual dictionary
Cox et al. Tlk or txt? Using voice input for SMS composition
Cai et al. Using large language models to accelerate communication for users with severe motor impairments
US20110131033A1 (en) Weight-Ordered Enumeration of Referents and Cutting Off Lengthy Enumerations
Trost et al. The language component of the FASTY text prediction system
JP7845704B2 (en) Character conversion support system and method for supporting character conversion of the character conversion support system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20241129

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20251021

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20251204

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20251212

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20251212

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20260303

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20260326

R150 Certificate of patent or registration of utility model

Ref document number: 7845704

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150