JP4032775B2 - Encoding system and program - Google Patents
Encoding system and program Download PDFInfo
- Publication number
- JP4032775B2 JP4032775B2 JP2002056731A JP2002056731A JP4032775B2 JP 4032775 B2 JP4032775 B2 JP 4032775B2 JP 2002056731 A JP2002056731 A JP 2002056731A JP 2002056731 A JP2002056731 A JP 2002056731A JP 4032775 B2 JP4032775 B2 JP 4032775B2
- Authority
- JP
- Japan
- Prior art keywords
- master
- phrase
- character string
- name
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Description
【0001】
【発明の属する技術分野】
本発明は、表記にゆらぎのある語句のコード化を容易にするコード化処理技術、特に医療機関が疾病動向等の分析を行うために傷病名をコード管理する電子カルテシステム、もしくは保険者や審査支払機関が診療報酬明細書に記載された傷病名をコード化して統計処理を行うレセプト処理システムに関する。
【0002】
【従来の技術】
医師は患者を診察する際に病状、病態に基づき、その患者の傷病名を記録する。傷病名の表記方法は個々の医師の裁量に任されており、標準的な傷病名以外にも慣用的な傷病名、仮名遣いが異なるなど、同じ病状、病態を表現するにもさまざまな傷病名が発生する。加えて患者の病態、病状をより正確に表現するさまざまな修飾語句が付加されるため、傷病名の表記はさらに多岐にわたり、これらの表記ゆらぎが傷病名をコード管理する観点からは大きな障害となっている。
たとえば健康保険組合等の保険者は、各医療機関より発行された診療報酬明細書(以下、レセプトと言う)の傷病名欄に記載されている傷病名を集計し、効果的な保健事業展開の目的で疾病動向の統計処理を行なっている。
疾病動向を分析するためには傷病名をコード化して集計する必要があるが、従来この作業はレセプトに記載された傷病名を知識、経験のある作業者が対応するコードに手作業で変換、集計していた。しかし保険者によっては月に数十万〜数百万件ものレセプトが届き、毎月集計を行うには時間的にもコスト的にも負担が重く、機械化されることが望まれている。
従来の技術によってこの傷病名読み取りの機械化を実現するには、たとえばOCR装置(文字読取装置)やパンチ入力によりレセプト記載の傷病名文字列を入力し、傷病名およびコードが格納された記録媒体である傷病名マスタと照合して該当傷病名をコード化する方法がある。ところがレセプト記載の傷病名文字列は前述した表記ゆらぎがあるため、傷病名マスタと照合しても確実にコードを得ることは必ずしも容易ではない。そのため、傷病名マスタとは別にユーザ辞書を設け、検出されなかったレセプト記載の傷病名文字列は対応するコードとともに登録しておく必要があった。
【0003】
【発明が解決しようとする課題】
従来の技術によって多くの傷病名を自動的にコード化するためには、より多くの表記ゆらぎ傷病名をユーザ辞書に登録しておかなくてはならない。
そのため従来の技術では傷病名マスタ照合時にコード化できなかった傷病名を目視により確認し、必要に応じてユーザ辞書に追加する必要があった。
ユーザ辞書への登録作業は、コード化できなかった傷病名に最も近いと思われる傷病名マスタ上の傷病名を探し出し、そのコードを対応付けることになる。この作業は手間がかかると同時に、登録するユーザによってばらつきや登録ミスが生じる可能性がある。
またコード管理に使用するコード体系を変更する際には、すべてのユーザ辞書上の傷病名をもう一度新たなコード体系を用いてコードを対応付け直さなくてはならない。
このようにユーザ辞書を用いたコード化技術はユーザにとって大変な労力を強いるため、極力標準的な傷病名マスタだけを用いてコード管理したほうが作業効率は各段に向上するとともに、ばらつきや登録ミスの防止の観点からも安全であるといえる。
したがって本発明の目的は、少ない負担でより多くの表記ゆらぎを傷病名マスタに照合しやすいコード化方法を提供することにある。
また本発明のもうひとつの目的は、傷病名マスタ照合の結果、完全に一致する傷病名がなかった場合には、適切と思われる傷病名とその一致度合いを評価し、ユーザに提示する環境を提供することにある。
また本発明のもうひとつの目的は、評価の結果ユーザが別の傷病名のコードに対応付ける場合、近似していると思われる傷病名マスタ上の傷病名を複数提示し、ユーザが最適な傷病名を選択できる手段を提供することにある。
【0004】
【課題を解決するための手段】
本発明の傷病名のコード化方法は上記目的を達成するために、
入力された傷病名を傷病名マスタに照合する前に、傷病名上の表記ゆらぎ部分を標準的な表記に変換してマスタ傷病名が検出されやすくする。
また、本発明の傷病名のコード化方法は上記目的を達成するために、
入力された傷病名文字列内に複数の傷病名や修飾語句が含まれている場合、それらがどのような構造で配置されているかを解析し、その結果を元に傷病名文字列内に含まれている傷病名を用いてコード化可能か否かをユーザに提示する。
また、本発明の傷病名のコード化方法は上記目的を達成するために、
ユーザが入力された傷病名文字列に対して、他のコードを対応付けるべきであると判断した場合、入力された傷病名の近似傷病名を複数検出してユーザに提示し、その中から適切なコードを選択できるようにする。
【0005】
【発明の実施の形態】
以下に本発明のコード化方法における第一の実施形態であるコード化システムについて説明する。
図1は本実施形態の基本構成図で、コンピュータ装置1に記録媒体に本発明のコード化方法を実行するプログラムが格納されている。図示されていないOCR装置、パンチ入力、フレキシブルディスクなどの外部記録媒体、他のコンピュータ装置とのネットワーク接続などを介して入力される傷病名文字列データ2はコンピュータ装置1内でコード化処理された結果、傷病名コード化結果データ3として出力される。傷病名コード化結果データ3の出力はフレキシブルディスクなどの外部記録媒体へ記録、ネットワーク接続などを介して他のコンピュータ装置に出力、あるいはプリンタによって帳票上に印刷されてもよい。
コンピュータ装置1は処理プログラムとして表記ゆらぎ標準化手段4、傷病名マスタ照合手段6、文字列構造解析手段8、近似傷病名検索手段10、照合結果修正手段12、制御手段14から構成される。また記録領域として表記ゆらぎテーブル5、傷病名マスタテーブル7、構造式テーブル9、近似傷病名テーブル11、コード化結果保存テーブル13、照合テーブル15を有し、処理結果を操作者が管理、修正するための周辺機器としてディスプレイ等の表示手段16とキーボード、マウス等の入力手段17を備える。
以下に図2を用いて本実施形態の大まかな動作について説明する。
まず外部より取得した傷病名文字列データ2である入力文字列は、表記ゆらぎ標準化手段4によって表記ゆらぎテーブル5に照合される。表記ゆらぎテーブル5にはあらかじめ慣用的表現や仮名遣いのゆらぎ語句と、その標準的な表記である標準語句が格納されており、ゆらぎ標準化手段4は表記ゆらぎテーブル5より入力文字列内のゆらぎ語句を検出し、対応する標準語句に変換する。
図2の例では傷病名文字列データ2として入力文字列「右前腕接触性皮フ炎」が入力されている。「皮膚」という語句は、慣用的に「皮フ」という表記で記されることがあり、表記ゆらぎテーブル5上には、あらかじめゆらぎ語句として「皮フ」、その標準語句として「皮膚」が登録してある。そのため入力文字列「右前腕接触性皮フ炎」は「右前腕接触性皮膚炎」という標準化文字列に変換される。このように表記ゆらぎ標準化手段4と表記ゆらぎテーブル5を用いることにより、入力文字列の中に含まれている慣用的な表現や、仮名遣いのばらつきによる表記ゆらぎを標準的な表記に変換することができる。したがって表記にゆらぎのある入力文字列も標準的な文字列としてコード化が可能になる。同様の効果を従来の技術のようにゆらぎ標準化手段4と表記ゆらぎテーブル5を用いずに実現する場合、ユーザ辞書には「皮膚炎」、「皮膚裂傷」のように「皮膚」という語句の含まれるすべての傷病名を「皮フ」と書き換えた語句である「皮フ炎」、「皮フ裂傷」をコードとともに登録しておかなくてはならない。「皮膚」がつく標準的な傷病名だけでも400種類以上あり、すべての表記ゆらぎに対して登録を行えば、ユーザ辞書は巨大なものになる。このためユーザ辞書への登録作業の負担、照合時間が著しく増大するとともに、登録時の入力ミスによるコード化変換の危険性も増大する。
よって本実施携形態によるコード化方法のように、傷病名全体をユーザ辞書に登録するのではなく、表記ゆらぎ部分のみを変換した上で標準的な傷病名マスタに照合したほうが効率的で、登録ミスの危険性が低減する。
次に生成された標準化文字列は傷病名マスタ照合手段6によって傷病名マスタテーブル7に照合される。傷病名マスタテーブル7には、標準的な傷病名および傷病名に付加される修飾語句がマスタ語句として登録されており、またそれぞれのマスタ語句に対応するコードおよび語句属性が格納されている。傷病名マスタ照合手段6は標準化文字列の中に含まれているすべてのマスタ語句を検出、その語句のコードおよび語句属性を抽出する。
ここでいう語句属性とはマスタ語句の種類を示すパラメータであり、傷病名なのか修飾語なのか、修飾語句であるならばどのような種類の修飾語句なのかを分類するために使用する。図2の例では標準化文字列「右前腕接触性皮膚炎」を傷病名マスタテーブル7に照合した結果、マスタ語句「右」、「前腕」、「接触性皮膚炎」が検出され、それぞれの語句属性は位置を示す修飾語句である「位置」、身体の一部を示す修飾語句である「部位」、傷病名であることを示す「傷病」であるという結果を得ている。
マスタ照合の結果より、入力された傷病名文字列は位置、部位に関する修飾語句を含んだ傷病名「接触性皮膚炎」であり、そのコードは「6929196」であると判断できる。しかし一般に入力文字列に傷病名と修飾語句が含まれている場合、その傷病名が入力文字列に対応する傷病名であると断定することはできない。たとえば入力文字列が「皮膚炎(接触性)」のように記載されていることもあり、この場合傷病名マスタに照合した結果、「皮膚炎」という傷病名と「接触性」という「病因」を示す修飾語句として検出され、連続した「接触性皮膚炎」という傷病名は検出できない。したがってコードは「皮膚炎」を意味する「6869043」となる。このように傷病名文字列に含まれている傷病名をそのままコード化しても必ずしも適切なコード化結果が得られないこともある。
そこで本実施形態では入力文字列に含まれる傷病名、修飾語句などのマスタ語句がどのように配置されているかを示す構造式という概念を用いて、コード化結果が正当なものであるか否かを評価する。
構造式によるコード化評価には文字列構造解析手段8と構造式テーブル9を用いる。文字列構造解析手段8は傷病名マスタ照合手段6の生成した照合結果のうち語句属性に着目し、傷病名文字列内に検出されたマスタ語句の順に対応する語句属性を並べ、これを構造式として扱う。文字列構造解析手段8は構造式テーブル9にこの構造式を照合し、同一の構造式が検出された場合には対応する構造評価より、入力された傷病名文字列に含まれる傷病名のコードを採択できるか否か判断する。また同一の構造式が発見されなかった場合には採択不可と判断する。
図2の例では「右前腕接触性皮膚炎」の場合であれば、その構造式は「位置部位傷病」である。この構造式は構造式テーブル9においてその構造評価を「良」として登録されており、したがって傷病名文字列内に含まれている傷病名「接触性皮膚炎」のコードを採択可能であると判断する。
傷病名と修飾語句によって構成される傷病名文字列は、その組み合わせが無限にあるため、一つ一つの傷病名文字列に対して適切なコード化が行われているかどうか評価するのは困難である。しかし本実施形態のように傷病名文字列を構造式に置換えれば、そのほとんどが数百種類程度に収束できるので、構造式毎に採択可能であるかどうか評価すれば、ほとんどの傷病名文字列は自動的にコード化可能か否か判定できる。したがって入力された傷病名が傷病名マスタに一致する傷病名がなかった場合でも、ユーザは目視による確認を最小限に絞り込むことができる。
構造式毎の評価方法は以下のとおりである。一般に傷病名文字列に傷病名と「位置」や身体の「部位」を示す修飾語句が含まれていても、それらの修飾語句が傷病名に対する影響は少ないと考えられる。たとえば「右前腕接触性皮膚炎」が「左下腿接触性皮膚炎」であっても、「接触性皮膚炎」であることに変わりはない。しかし含まれている修飾語句が「病因」や「状態」を示すものであると、これらの傷病名は別の標準的な傷病名で言い表せる可能性があるため、傷病名文字列内に含まれている傷病名がそのまま採用できるとは限らない。また傷病名文字列内に複数の傷病名が検出された場合も、それが単に傷病名の羅列なのか、あるいは二つの傷病名で一つの意味を示しているか判断が難しく、最終的にはユーザによる目視確認を要する。
構造式によるコード化結果評価の提示、ユーザによる目視確認は照合結果修正手段12によって行う。照合結果修正手段12はここまでの処理によって求められた入力文字列、標準化文字列、マスタ語句として抽出された傷病名およびそのコード、構造評価をユーザに提示する。ユーザはこれらの情報をもとにこのコード化結果が採択可能であるか否かを判断し、必要に応じて修正を加える。これらのコード化結果はコード化結果保存テーブル13に格納し、必要に応じて出力される。
コード化結果の修正には近似傷病名検索手段10および近似傷病名テーブル11を用いる。近似傷病名検索手段10は表記ゆらぎ標準化手段4によってすでに生成されている標準化文字列を近似傷病名テーブル11にあいまい検索を行い、標準化文字列と近似している複数の傷病名およびそのコードを抽出する。このあいまい検索結果は再び照合結果修正12によってユーザに提示され、ユーザは提示されたいくつかの傷病名の中でもっとも適切であると思われる傷病名を選択することにより、そのコードがコード化結果保存テーブル13に格納される。
従来の技術によればこの近似傷病名検索作業はユーザの手によって行われ、ユーザは傷病名とコードの対応表などをもとに適切な傷病名を探し出し、そのコードを入力することによりコード化していた。しかしこの方法ではユーザの検索作業の負担は大きく、またより適切な傷病名があるにもかかわらず他の傷病名のコードを登録してしまったり、コード入力時の入力ミスにより誤ったコードを登録してしまう危険性があった。本実施形態では事前に構造評価を行い、目視確認を要する必要最小限の入力文字列を抽出し、ユーザによるコードの変更は複数の近似傷病名の中からもっとも適切な傷病名を選択する作業によって実現するため、ユーザのコード化作業の負担は著しく低減するとともに、入力ミス等によるコード化の誤りを最大限抑制することが可能である。
以上のように、本実施形態によれば表記にゆらぎのある入力文字列を、より少ないユーザ作業負担により的確にコード化することが可能なコード化システムを提供することができる。
以下に図3、図4を用い、本実施形態の表記ゆらぎ標準化手段4と表記ゆらぎテーブル5の詳細な説明を行う。
図3は本実施形態の表記ゆらぎテーブル5の具体例を示す図である。表記ゆらぎテーブル5には、少なくとも慣用的な表記や仮名遣いのばらつきであるゆらぎ語句301と、それに対応する標準的な表記である標準語句302が格納されている。
表記ゆらぎテーブル5の目的は医師の自由裁量によって記載される様々な傷病名の表記ゆらぎを、傷病名マスタテーブル7に格納されているマスタ語句の表記に収束させることにある。よってゆらぎ語句には傷病名によく見受けられる表記のばらつき、たとえば慣用的な表記(「皮膚」と「皮フ」)、ひらがな/カタカナ/漢字表記の違い(「びらん」、「ビラン」、「糜爛」)、漢字の違い(「頸」と「頚」)、発音の違い(「ウィルス」と「ウイルス」)、長音記号の有無(「カタール」と「カタル」)などを、それぞれ傷病名マスタテーブル7に登録されている標準的な表記である標準語句とともに格納する。
図4は表記ゆらぎ標準化手段4の詳細な動作を示すフローチャート図である。
まずステップ401で制御手段14により傷病名文字列データ2として取りこまれた入力文字列を表記ゆらぎ標準化手段4に取りこむ。
次にステップ402で表記ゆらぎテーブル5のゆらぎ語句301を参照し、入力文字列の一部に該当する語句がないかどうかを検索する。
もし該当するゆらぎ語句が発見された場合には、ステップ403でそのゆらぎ語句の部分を表記ゆらぎテーブル5の標準語句302に格納された語句に置換する。ステップ402、403によりすべてのゆらぎ語句が標準語句に変換されたら、ステップ404にてその文字列を標準化文字列として制御手段14に返す。
このとき変換されるのは必ずしも入力文字列の一部とは限らず、入力文字列全体がゆらぎ語句として標準語句に変換されたり、入力文字列にゆらぎ語句が検出されずにそのまま標準化語句として制御手段14に返されることもある。
以上、表記ゆらぎ標準化手段4と表記ゆらぎテーブル5により、入力文字列に含まれる表記ゆらぎが標準化され、次の工程である傷病名マスタテーブル6への照合の際に、より多くの傷病名文字列がコード化可能になる。
従来技術のようにユーザ辞書に表記ゆらぎを含む傷病名文字列とその対応するコードを格納する方法と比較し、本実施形態ではあくまで文字列上で表記ゆらぎを標準化するだけなので、次の工程で用いる傷病名マスタテーブル7に依存することがない。
つまり傷病名マスタテーブル7で用いるコード体系を変更するような場合、ユーザ辞書はすべての登録傷病名文字列のコードを新たなコード体系に基づき変更しなくてはならないが、本実施形態では文字列を置換えるだけなので、コード体系には依存しない。したがってユーザ辞書のコードをすべて書きかえるような膨大な作業負荷を回避することができる。
以下に図5、図6、図7、図8、図9を用い、本実施形態の傷病名マスタ照合手段6と傷病名マスタテーブル7の詳細な説明を行う。
図5は本実施形態における傷病名マスタテーブル7の具体例を示す図である。傷病名マスタテーブル7には少なくとも傷病名、修飾語句などのマスタ語句501とそれに対応するコードであるコードA502、コードB503及びマスタ語句の種類を表す語句属性504が格納される。格納されるコードは必ずしも二種類である必要はなく、一種類もしくは三種類以上格納してもかまわない。
一般に広く使われているコードとしては、レセプトに記載する傷病名のコード化を主な目的とするレセプト電算処理システムの病名マスタと修飾語マスタがあり、数多くの傷病名や修飾語がコード付けされている。また傷病名をもとに疾病動向分析を行う際など、あまりコードの種類が多すぎると分類が細かくなりすぎる場合には、膨大な数の傷病名を119項目に分類してコード付けしてある社会保険表章用疾病分類(中分類コード)がよく用いられる。このようにコードはその利用目的によってユーザが選択できることが好ましく、傷病名マスタテーブル7に複数のコード体系を格納しておけば、ユーザの利用目的に合わせて適切なコード体系を選択することができる。
図6は傷病名マスタテーブル7に格納される語句属性504の例を示す表である。本実施形態では傷病名マスタテーブル7に格納されるすべてのマスタ語句に語句属性が対応付けられている。しかし傷病名文字列として自由に記載される可能性のあるすべての語句をマスタ語句として登録することはできないので、マスタ語句として登録されていない文字列は語句属性が「未知」であるとして扱う。
図7は傷病名マスタ照合手段6の詳細な動作を示すフローチャート図である。
まずステップ701で制御手段14により標準化文字列を入力文字列として傷病名マスタ照合手段6に取りこむ。
ステップ702では傷病名マスタテーブル7のマスタ語句501を参照し、入力文字列の一部に該当する語句がないかどうかを検索する。
ステップ703にて該当する語句が検出された場合、ステップ704でそのマスタ語句501、コードA502、コードB503、語句属性504を照合テーブル15に格納する。すべての該当するマスタ語句が照合テーブル15に格納されたら、ステップ705で必要なマスタ語句だけを選択し、残りのマスタ語句は照合テーブル15より消去する。これはたとえば「前腕」という語句に検出されるマスタ語句は「前」、「腕」、「前腕」と3種類あるが、必要なのは「前腕」だけであり、他のマスタ語句は不用だからである。
ステップ706では最終的に選択されたマスタ語句と、そのもとになる入力文字列を比較し、入力文字列内にマスタ語句が検出されなかった連続する部分文字列を語句属性「未知」として照合テーブル15に格納する。このときコードA、コードBには何も格納されない。
図8は図7のステップ705において必要なマスタ語句だけを選択するためのルールを説明する表である。マスタ照合により複数のマスタ語句が検出された場合、検出されたマスタ語句A、マスタ語句Bの入力文字列内での位置、文字数からマスタ語句A、Bいずれが選択されるべきかを調べている。
図8の1)から3)のようにマスタ語句Aとマスタ語句Bの関係がいずれか一方が他方の語句に内含されてしまう関係にあるならば、長いほうのマスタ語句が選択される。たとえば「前腕」と「前」とでは「前腕」が選択される。
図8の4)のようにマスタ語句Aとマスタ語句Bが入力文字列内でまったく重ならない関係であれば、両者とも独立したマスタ語句であるため、いずれも選択する。
図8の6)から8)のようにマスタ語句Aとマスタ語句Bが前後にずれて入力文字列内に配置されている場合、マスタ語句Aとマスタ語句Bいずれか文字数の多いほうを選択するが、文字数の同一である場合に限って6)のように後方にずれているほうを選択する。
図9は図7のステップ705において必要なマスタ語句が選択され、ステップ706で未知の文字列が登録される前後の照合テーブル15の状態を示す図である。
図9では例として「右前腕接触性皮膚炎の可能性」という傷病名文字列が傷病名マスタ照合手段6に入力されたとする。マスタ照合の結果、マスタ語句として傷病名マスタテーブルより検出されたのは「右」、「前」、「前腕」、「腕」、「接触性皮膚炎」の5個のマスタ語句であり、図9の上の表に示すように照合テーブル15にはそれぞれのマスタ語句、コードA、コードBおよび語句属性が格納される。
その後、図7のステップ705により、図8に示した選択ルールに則り必要なマスタ語句だけを選択した結果、「右」、「前腕」、「接触性皮膚炎」だけが残る。次にステップ706が入力文字列との比較を行った結果、「の可能性」という文字列がマスタ語句として検出されなかったことがわかるため、この「の可能性」を語句属性「未知」であるマスタ語句として照合テーブル15に登録した結果、図9の下の表に示す通りになる。
以上、傷病名マスタ照合手段6と傷病名マスタテーブル7により、入力された傷病名文字列に含まれる各マスタ語句のコードが取得される。また語句属性の取得により次の工程である文字列構造解析手段8で構造解析を行い、このコード化結果の評価を行うことができる。
以下に図10、図11を用い、本実施形態の文字列構造解析手段8と構造式テーブル9の詳細な説明を行う。
図10は本実施形態における構造式テーブル9の具体例を示す図である。構造式テーブル9には少なくとも語句属性の組み合わせである構造式1001と、その構造式を有する傷病名文字列を検出された傷病名のコードで採択可能であるか否かを示す構造評価1002が格納されている。またその構造式がどのような理由で採択可否であるかの説明文であるコメント1003も格納しておけば、ユーザによる目視確認の際にコメント1003もユーザに提示し、的確な判断を促す補足説明を行うことができる。
構造評価1002は必ずしも採択可否の二値である必要はなく、図10に示すように「優」、「良」、「可」、「不可」などと数段階に分類して登録しておくことにより、ユーザは目視確認の際に構造評価1002を参照し、厳密にコード化したい場合には「優」以外すべて、さほど厳密さが要求されない場合には「不可」のみ目視確認するなど、ニーズや状況に応じてコード化の精度を使い分けることが可能になる。
図11は文字列構造解析手段8の詳細な動作を示すフローチャート図である。
まずステップ1101で照合テーブル15にある傷病名文字列内に検出されたマスタ語句を傷病名文字列内に出現した順番に並べ替え、各マスタ語句に対応する語句属性を並べ替えられたマスタ語句の順番通りに並べて連結し、構造式を得る。たとえば「左前腕接触性皮膚炎」の構造式は「位置部位傷病」になる。
ステップ1102にて文字列構造解析手段8は構造式テーブル9の構造式1001を参照し、ステップ1101で得られた構造式と同一の構造式を検索する。
ステップ1103で構造式テーブル9内に同一の構造式が検出された場合は、ステップ1104で該当する構造式の構造評価1002とコメント1003を制御手段14に返す。
またステップ1103で同一の構造式は検出されなかった場合には、構造評価を「不可」、コメントを「構造式が登録されていません」として制御手段14に返す。
以上、文字列構造解析手段8と構造式テーブル9により、入力された傷病名文字列に含まれるマスタ語句の語句属性の配列である構造式を用いて、その傷病名文字列に含まれる傷病名のコードを傷病名文字列のコードとして用いることが可能であるか否かの構造評価ができる。よってユーザは傷病名文字列が完全にマスタ語句と一致しなかった場合でも、その傷病名文字列とコード化結果を目視確認する必要があるか、構造評価を元に判断することができるため、目視確認作業を必要最小限に絞り込むことができる。
以上のように入力された傷病名文字列の表記ゆらぎの標準化、マスタ照合によるコードの取得、構造評価によるコード化結果の評価の一連の処理は自動的に行うことが可能である。したがってユーザは大量の傷病名文字列が入力された場合でも、すべての傷病名文字列の自動処理終了後に表示画面を閲覧し、構造評価により自動コード化できない傷病名文字列だけを目視確認し、必要に応じて他にコードに書き換えることができる。
以下に図12、図13を用い、本実施形態の照合結果修正手段12とコード化結果保存テーブル13の詳細な説明を行う。
図12は本実施形態におけるコード化結果保存テーブル13の具体例を示す図である。
次々と入力された傷病名文字列は各工程を経てコード化され、コード化結果保存テーブル13に蓄積されていく。コード化結果保存テーブル13に格納される項目は、まず入力されたそのままの文字列である入力文字列1201、次に表記ゆらぎ標準化手段4により標準化された標準化文字列1202、傷病名マスタ照合手段6により抽出されたマスタ語句のうち、語句属性が「傷病」である採用傷病名1203、採用傷病名1203のコードであるコードA1204、採用傷病名の他のコード体系によるコードであるコードB1205と続く。その次のコードA列1206とは傷病名マスタ照合手段6により抽出されたマスタ語句すべてのコードを出現順に並べたものであり、傷病名や各種修飾語句を示すコードの羅列である。
続いて文字列構造解析手段8により求められた構造式1207、および構造評価1208、コメント1209も格納されている。
図12では構造式1207の見読性を高めるために、語句属性が「未知」である語句や、「括弧」、「接続」である語句を元の文字列を用いて表示してある。すなわち、番号4の入力文字列「喘息様気管支炎」は、「喘息」および「気管支炎」はマスタ語句として検出されたが、中間の「様」は「未知」である語句であるため、ここでは「傷病[様]傷病」と表示する。また同様に番号7の「扁桃炎(慢性)」の括弧の語句属性は「括弧」であるが、ここでは「傷病(経過)」としている。
図13は照合結果修正手段12により表示手段16に表示された画面の具体例である。
この画面はコード化結果保存テーブル13に蓄積されたコード化結果とその評価をユーザに提示し、ユーザの手による修正が必要であるか否か判断を促すためのものである。
リスト1301はコード化結果保存テーブル13に蓄積された各入力文字列、およびユーザが修正の必要性を判断するために必要な主な項目の一覧である。
ボタン1302およびボタン1303はリスト1301に表示する内容の切り替えを行うボタンで、全コード化結果を表示するか、構造評価に基づき要目視確認であるコード化結果のみ表示するかを選択できる。このときコード化結果を表示する構造評価はユーザが前もって設定しておく。たとえばユーザによっては構造評価が「不可」、他のユーザにおいては「可」と「不可」というように設定を変えることにより、コード化修正作業の作業量を自由に増減することが可能である。したがってユーザは入力文字列の数、必要なコード化精度、費やせる作業量により要目視確認傷病名の量を自在に制御することが可能である。
テキストボックス1304から1312は、リスト1301で選択された番号に関するコード化結果保存テーブル13に蓄積されたデータが表示されている。ユーザはこれらの情報をもとにより精細な判断をすることが可能になる。
ボタン1313はリストから選択されたこの入力文字列をもう一度自動コード化の一連の工程に流す場合、ボタン1314はこのコード化結果を採用する場合、そしてボタン1315はこのコード化結果が満足のいかないものであり、後述する近似傷病名検索によってコード化したいとユーザが判断した場合、近似傷病名検索を実行するためのボタンである。ユーザがこのコード化結果を採用すると判断した場合、かならずしもボタン1314を押さなくても、ボタン1315により近似傷病名検索が行われなければ、採用されたものと判断しても構わない。
このようにユーザは照合結果修正手段12により表示された画面をもとに修正が必要と思われる入力文字列だけを閲覧できる。またそのコード化結果をよく吟味した結果、修正が必要と判断したのであれば、この画面から後述する近似傷病名検索画面を表示し、そこでさらに適切なコードを検索することができる。
本実施形態における近似文字列検索の例として、自然言語処理によく用いられるNグラムを用いたあいまい検索手法がある。一般に語句や文章内で隣接する長さNの文字列をNグラムと呼び、たとえば文字列「心筋梗塞」の1グラムは「心」、「筋」、「梗」、「塞」であり、2グラムは「心筋」、「筋梗」、「梗塞」である。このように文字列をグラムに分解し、同様にマスタテーブルにもマスタ語句をグラムに分解したものを格納しておけば、両者に存在するグラムの数が多いほど両者の文字列は近似しているということがわかる。当然同一の文字列であれば、すべてのグラムが一致するが、たとえば文字がいくつか欠けていたり、語順が逆になっている場合でも多くのグラムは一致するため、両者はかなり近い文字列であるなどと判断する。
以下に図14、図15、図16を用い、本実施形態における近似傷病名検索手段10と近似傷病名テーブル11の詳細な説明を行う。
図14は本実施形態の近似傷病名テーブル11の具体例を示す図である。
近似傷病名テーブル11には傷病名マスタテーブル7に格納されているマスタ語句がグラムに分解された状態で格納されており、傷病名マスタ番号1401には傷病名マスタテーブル7において各マスタ語句を管理している番号、そしてグラム1402にはそのマスタ語句のグラムが格納されている。
図14の例ではマスタ語句番号1の「心筋梗塞」と2の「アレルギー性鼻炎」の1グラムと2グラムが格納されている。
Nグラムにおいては文字列の長さNをいくつにするかにより、あいまい検索の精度が変化するが、傷病名の検索においては1と2の両方を用いるのが検索精度とテーブルの容量のバランスからちょうどいい。もちろん3グラム以上を用いてもかまわない。
また近似傷病名テーブル11にグラムを格納するマスタ語句は、傷病名マスタテーブル7に格納されたすべてのマスタ語句である必要はなく、目的が傷病名の検索であるから語句属性が「傷病」である傷病名、もしくはその中でも代表的な傷病名だけに限り、選択肢を減らして選択しやすいようにすることも可能である。図15は近似傷病名検索手段10の詳細な動作を示すフローチャート図である。図13に示した画面でユーザが選択した入力文字列が近似傷病名検索するよう命じられると、ステップ1501はその傷病名文字列の標準化文字列の1および2グラムを生成する。このときグラム分解する文字列は入力文字列そのものでもよいが、標準化文字列を用いたほうが検索精度は向上する。
ステップ1502では生成したグラムを近似傷病名テーブル11に格納された部分文字列1402に照合する。一致するグラムがある場合、その傷病名マスタ番号1401ごとに一致したグラム数を集計する。
ここでより多くのグラムが一致するほど近似した傷病名といえるが、本実施形態では両者の近似度合いを定量的に示す適合率として、
(一致したグラム数)÷(マスタ語句のグラム数)
を用いる。
グラムの一致の見られたマスタ語句は照合結果修正手段12に渡され、ステップ1504で表示手段16を用いて適合率の高い順にマスタ語句、コードA、コードBとともにユーザに提示される。
ステップ1505でユーザ入力手段17を用いて、これらのマスタ語句の中からもっとも適切を思われるマスタ語句を選択することにより、ステップ1506でそのマスタ語句の各種データが入力文字列の新たなコード化結果としてコード化結果保存テーブル13に格納される。
図16はステップ1504で照合結果修正手段12により表示手段16に表示される画面の具体例である。図13の画面より近似傷病名検索の実行を命ぜられるとこの図16の画面が表示されるが、上半分の入力文字列リストは図13と同じものである。画面下半分が近似傷病名検索のための表示であり、テキストボックスにリストで選択された入力文字列1501とその標準化文字列1502が表示されている。
グラムを用いたあいまい検索の結果である近似傷病名検索結果は画面右下のリストに表示されており、それぞれグラムの一致が見られたマスタ語句である候補傷病名1503、そのコードA1504、コードB1505、そして適合率1506(パーセント表示)である。
リストに表示されるもののうち、コードA1504、コードB1505は必ずしも必須ではないが、他の候補傷病名と見比べることにより、どの候補傷病名が適切であるかより判断が容易になる。
また各候補傷病名は適合率の高い順に上から表示することにより、ユーザは一致度の高い候補傷病名から順に吟味できるため、選択作業が容易になる。
ここで適合率として
(一致したグラム数)÷(マスタ語句のグラム数)
を用い、
(一致したグラム数)÷(標準化文字列のグラム数)
を用いないのは、両者の一致度の順番が異なるからである。
前者ではたとえば「接触性皮膚炎」を検索した場合、「接触性皮膚炎」とともに「皮膚炎」もそれぞれ適合率1としてリストの最上位に表示される。しかし後者を適合率として用いると「接触性皮膚炎」は同様に適合率1としてリスト最上位に表示されるが、「皮膚炎」はおおよそ半分のグラムしか一致してないことになるので、かなり下方に表示されることになる。
一般に傷病名の検索を行う場合、完全に一致する傷病名が見つからないのであれば、その傷病名をもっと広く捉えた傷病名、すなわち「接触性皮膚炎」なら「皮膚炎」、「急性気管支炎」なら「気管支炎」を選択することが自然である。
したがって前者の適合率を用いることにより、その傷病名を広く捉えた傷病名をより適合率が高いと評価でき、ユーザの選択作業に適した優先順位で候補傷病名を提示することができる。
ユーザは近似傷病名検索により、自動コード化処理より適切な傷病名をリストから見つけた場合、その候補傷病名を選択し、「採用」ボタン1507を押すことにより、その結果をコード化結果保存テーブル13に格納できる。また選択しない場合には「構造解析」ボタン1508を押すことにより図13の画面に戻り、自動コード化によるコード化結果を採用することも可能である。
近似傷病名検索による傷病名文字列のコード取得は、従来の技術のようにユーザが幾万とある標準的な傷病名の中からもっとも適切なものを選び出し、そのコードをパンチ入力等で入力するのに対し、はるかに容易でかつ入力ミスによる誤登録を防ぐ効果が高い。
また適切なコードが見つからない場合でも、容易にその傷病名文字列を広義に捉えた傷病名を抽出することができるので、ユーザの知識や経験の違いによるコード化結果のばらつきが少なく、だれでもおおよそ同じようなコード化結果を取得することが可能である。コード化結果の一貫性は、別の疾病動向分析結果と比較するような際に、解釈の相違による結果の違いを防ぐことができ、統計解析上重要である。
図17は本実施形態における近似傷病名検索後のコード化結果保存テーブル13の具体例を示す図である。
ここでは図12の時点で構造評価が「不可」であった入力文字列1701の「喘息様気管支炎」、「臭覚障害」、「扁桃炎(慢性)」が近似傷病名検索を行われた結果、より適切なコードに更新されている。また構造評価1708が近似傷病名検索による結果であることを示す「近似」に変わり、コメント1709にもその旨表示されている。近似傷病名検索ではコードA列1706、構造式1707は生成されないため、表示は空欄である。
近似傷病名検索では様々な傷病名文字列をコード化することができ、たとえば図17では「喘息様気管支炎」(喘息のような症状の気管支炎)と「喘息性気管支炎」(喘息による気管支炎)にように意味の近い傷病名、「臭覚障害」と「感覚障害」のようにより広義な傷病名、「扁桃炎(慢性)」と「慢性扁桃炎」のように語順違いの表記なども容易にコード化できる。
コード化結果保存テーブル13に蓄積されたコード化結果は任意にコンピュータ装置1外に出力することができ、ユーザはこの情報を元に集計、統計処理を行い、疾病動向分析などに活用することができる。
以下に図18、図19を用い、本実施形態における各種テーブルの保守画面について説明する。
図18は表記ゆらぎテーブル5の保守画面の具体例を示す図である。
保守画面には表記ゆらぎテーブル5に格納された語句を一覧するリストがあり、少なくともゆらぎ語句1801、標準語句1802が表示されている。変換回数1803はそのゆらぎ語句と標準語句が表記ゆらぎ標準化手段4によって利用された回数の累積である。
ユーザはこのリストを見ながらボタン1804により新たなゆらぎ語句と標準語句を追加したり、あるいはボタン1805により不要なゆらぎ語句と標準語句を削除、ボタン1806により語句の内容を変更したり、あるいはボタン1807により編集しないで保守画面を終了することができる。
随時入力される傷病名文字列を効率的にコード化するには、常に表記ゆらぎテーブルの最適な状態に保つことが好ましい。したがって新たに発生した表記ゆらぎによるコード化結果の不良があれば、新たなゆらぎ語句、標準語句を追加したり、あるいは以前登録したゆらぎ語句と標準語句がその後ほとんど利用されていないようであれば、削除したほうが照合負荷が低減し、より高速な変換が可能になる。変換回数1803はゆらぎ語句と標準語句の利用状況を把握するための目安として表示されている。
図19は構造式テーブル9の保守画面の具体例を示す図である。
保守画面には構造式テーブル9に格納された構造式を一覧するリストがあり、少なくとも構造式1901、構造評価1902が表示されている。また構造評価をユーザに提示する際に、より詳細な情報を付加するためにコメント1903も表示されている。
ユーザはこのリストを見ながらボタン1904により新たな構造式を追加したり、あるいはボタン1905により不要な構造式を削除、ボタン1906により構造式や構造評価を変更したり、あるいはボタン1907により編集しないで保守画面を終了することができる。
構造式は本実施形態においてコード化結果の評価に用いる指標であり、新たな構造式を追加する場合、あるいは構造評価がユーザの意図しないものであった場合、この保守画面で構造評価の調整を行う必要がある。
以下に図20、図21を用いて、本発明のコード化方法における第二の実施形態であるコード化システムについて説明する。
前述した本発明の実施形態では、マスタ照合による自動コード化の結果が適切でないとユーザが判断した場合、そのつどユーザは近似傷病名検索を行い、適切なコードに変換する必要がある。この場合、同じ傷病名文字列が入力された場合、また同じ処理をユーザに負担させることになる。
図20に示す本実施形態の構成図では、図1の前述した実施形態に加えて変換歴記録手段18、変換歴検索手段19、変換歴テーブル20を設けている。
自動コード化されてかつ、ユーザによって採用と判断された結果、もしくはユーザによって近似傷病名検索された結果、コード化結果保存テーブル13に格納された入力傷病名文字列、標準化文字列、コードA、コードB、コードA列、構造式、構造評価、コメントは変換歴記録手段18によって変換歴テーブルに格納される。
本実施形態において傷病名文字列が入力された場合、制御手段14はまず変換歴検索手段19にその傷病名文字列を渡し、変換歴検索手段19は変換歴テーブルに同一の入力文字列を検索する。
同一の入力文字列が検出された場合、変換歴検索手段19はそのテーブル内の情報を制御手段14に返し、制御手段14は照合結果修正手段12を介し、コード化結果保存テーブル13に記録する。
本実施形態によれば、一度ユーザにより採用されたうえでコード化結果保存テーブル13に格納されたコード化結果は変換歴テーブル20に格納され、次回同じ傷病名文字列が入力された場合は、変換歴テーブル20からコード化結果保存テーブル13に登録されるため、途中の様々な処理を省略することが可能になる。したがって特に大量の傷病名文字列が入力され、その中に同一の傷病名文字列が多く含まれている場合、著しい処理速度の向上が可能になる。
図21は本実施形態における照合結果修正手段12により表示手段16に表示される画面の具体例である。
前述した実施形態の図16と同様の近似傷病名検索結果の表示画面であるが、図21では加えてボタン2101が設けられ、ユーザはこの近似傷病名検索結果を変換歴テーブル20に格納するか否かを選択することが可能である。したがってユーザは任意のコード化結果のみを次回も同様なコード化結果を得るように調整することが可能である。
以下に図22、図23を用いて、本発明のコード化方法における第三の実施形態であるコード化システムについて説明する。
図22は本実施形態の構成図で、第一の実施例の構成図である図1の入力である傷病名文字列データ2に対し、本実施例ではコード化処理を行うコンピュータ装置1は診療情報データベース18に接続され、ここから入力情報を得ている。診療情報データベース21とは電子カルテとかレセプト処理システムなどの診療情報を管理するデータベースで、傷病名以外にも患者情報、診療行為情報、会計情報など、さまざまな情報が蓄積されている。
本実施形態ではコード化を行う際に傷病名文字列以外にもさまざまな診療情報が得られるため、これらの情報を目視確認、ユーザによるコード修正の際に参照することが可能になる。
図23は本実施形態における表示手段18に表示される画面の具体例である。表示手段17には第一の実施形態で図13、図15を用いて説明した照合結果表示画面2301が表示され、加えて診療情報データベース21より取得された診療情報表示画面2302も表示されている。診療情報表示画面2302は文字情報であったり、画像情報でもかまわない。
ユーザは照合結果表示画面2301を用いてコード化結果を確認し、必要に応じて修正を加える際、診療情報表示画面2302を参照することにより、傷病名文字列が診断結果として採用された経緯を知ることができ、より精度良くコードの修正をすることが可能になる。
本発明の要点をまとめると以下のようになる。
入力した文字列をマスタ照合によりコード化する際、あらかじめ文字列の中の表記ゆらぎのある語句を標準的な語句に変換する。
さらに、入力した文字列の中の表記ゆらぎのある語句を標準的な語句に変換するために、表記ゆらぎの語句と標準的な語句を対にして記憶領域に格納する。
さらに、記憶領域に格納された表記ゆらぎのある語句と標準的な語句の対を編集する表示画面を有する。
入力した文字列をマスタ照合によりコード化する際、文字列に含まれているひとつ、あるいは複数のマスタに登録された語句を検出し、その語句属性の配列を生成し、配列ごとにコード化可能か否か評価する。
さらに、語句とコードおよび属性を記憶領域に格納する。
さらに、語句属性とコード化可能か否かを示す構造評価を記憶領域に格納する。さらに、記憶領域に格納された語句属性の配列と構造評価を編集する表示画面を有する。
さらに、入力された文字列とコード化した結果を表示する際、評価の結果、修正する必要のある入力文字列の分だけ表示できる。
さらに、評価の結果、修正の必要があればこの画面からあいまい検索を行う画面を表示する。
入力された文字列とコード化した結果を記憶領域に格納し、次回同一の文字列が入力された際には、そのコード化結果を出力する。
さらに、入力された文字列とコード化した結果を記憶領域に格納するか否かを選択できる表示画面を有する。
入力された文字列とコード化した結果を表示する際、入力された文字列の元になる帳票のデータもしくは画像を合わせて表示する。
【0006】
【発明の効果】
以上のように本発明のコード化方法は、傷病名をコード化する際に、従来技術のように様々な傷病名の表記ゆらぎを含む傷病名をすべてユーザ辞書に登録するといった手間がかかり、登録ミスの起こりやすい作業を行わなくてすむようになるため、作業効率およびコード出力の信頼性が大幅に向上するという著しい効果がある。
また本発明によれば、従来技術のように傷病名マスタ照合時に未検出であった傷病名はすべて人の目視により確認し、必要に応じてユーザ辞書に追加する必要があったのに対し、自動的にコード化結果を評価してユーザに提示することにより、ユーザのニーズや用途に応じて最小限の目視確認、修正作業が可能になるという効果がある。
また本発明によれば、従来技術のように傷病名マスタ照合時に未検出であった傷病名をコード化する際に、パンチ入力等で直接コードを入力しなくてはならなかったのに対し、ユーザはもっとも適切な近似傷病名を選択することにより、そのコードが記録されるため、作業効率およびコード出力の信頼性が大幅に向上するという著しい効果がある。
【図面の簡単な説明】
【図1】本発明による一実施形態を示す基本構成図。
【図2】本発明による一実施形態を示す処理流れ図。
【図3】表記ゆらぎテーブルの一例を示す図。
【図4】表記ゆらぎ標準化手段のフローチャート図。
【図5】傷病名マスタテーブルの一例を示す図。
【図6】語句属性の種類を示す説明図。
【図7】傷病名マスタ照合手段のフローチャート図。
【図8】複数のマスタ語句が検出されたときの選択ルールを示す説明図。
【図9】照合テーブルの挙動を示す説明図。
【図10】構造式テーブルの一例を示す図。
【図11】文字列構造解析手段のフローチャート図。
【図12】自動処理後のコード化結果保存テーブルの一例を示す図。
【図13】自動処理後の照合結果修正手段におけるコード化結果表示画面の一例を示す図。
【図14】近似傷病名テーブル一例を示す図。
【図15】近似傷病名検索手段のフローチャート図。
【図16】近似傷病名検索時の照合結果修正手段におけるコード化結果表示画面の一例を示す図。
【図17】近似傷病名検索後のコード化結果保存テーブルの一例を示す図。
【図18】表記ゆらぎテーブルの保守画面例の一例を示す図。
【図19】構造式テーブルの保守画面例の一例を示す図。
【図20】本発明による第二の実施形態を示す基本構成図。
【図21】本発明による第二の実施形態における近似傷病名検索後の照合結果修正手段におけるコード化結果表示画面の一例を示す図。
【図22】本発明による第三の実施形態を示す基本構成図。
【図23】本発明による第三の実施形態における表示画面の一例を示す図。
【符号の説明】
1…コンピュータ装置
2…傷病名文字列データ
3…傷病名コード化結果データ
4…表記ゆらぎ標準化手段
5…表記ゆらぎテーブル
6…傷病名マスタ照合手段
7…傷病名マスタテーブル
8…文字列構造解析手段
9…構造式テーブル
10…近似傷病名検索手段
11…近似傷病名テーブル
12…照合結果修正手段
13…コード化結果保存テーブル
14…制御手段
15…照合テーブル
16…表示手段
17…入力手段
18…変換歴記録手段
19…変換歴検索手段
20…変換歴テーブル
21…診療情報データベース。[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a coding processing technology that facilitates coding of words with fluctuations in notation, in particular, an electronic medical record system for managing the names of wounds and diseases for medical institutions to analyze disease trends, etc., or insurers and examinations The present invention relates to a receipt processing system in which a payment institution encodes an injury / illness name described in a medical fee description and performs statistical processing.
[0002]
[Prior art]
When a doctor examines a patient, he or she records the name of the patient's injury based on the medical condition and condition. The notation method of injury and illness names is left to the discretion of individual doctors, and in addition to the standard injury and illness names, there are various injury and illness names to express the same medical condition and pathology, such as different idiomatic injury and illness names and kana names. appear. In addition, various modifiers that more accurately describe the patient's condition and medical condition are added, so the notation of wound names is more diverse, and these notation fluctuations are a major obstacle from the viewpoint of code management of wound names. ing.
For example, an insurer such as a health insurance association aggregates the names of injuries and sicknesses listed in the injuries and sickness names column of the medical treatment remuneration statement (hereinafter referred to as “receipt”) issued by each medical institution to effectively develop health services. Statistical processing of disease trends is performed for the purpose.
In order to analyze the disease trend, it is necessary to encode and summarize the names of wounds, but conventionally this work is done by manually converting the names of wounds and diseases described in the receipt into codes corresponding to experienced workers, I was counting. However, some insurers receive hundreds of thousands to millions of receipts per month, and it is desired that the monthly summation is heavy and burdensome in terms of time and cost.
In order to realize the mechanization of reading the name of sickness by the conventional technique, for example, the character string of the name of the sickness described in the receipt is input by an OCR device (character reading device) or punch input, and the recording medium storing the name of the sickness and the disease is stored. There is a method of coding a corresponding disease name by collating with a certain disease name master. However, since the injury / illness name character string described in the receipt has the above-described fluctuation, it is not always easy to reliably obtain a code even if it is checked against the injury / illness name master. For this reason, it is necessary to provide a user dictionary separately from the disease name master, and to register the disease name character strings described in the receipt that have not been detected together with the corresponding codes.
[0003]
[Problems to be solved by the invention]
In order to automatically code many names of injuries and diseases according to the conventional technique, it is necessary to register more notation fluctuation names in the user dictionary.
For this reason, it has been necessary to visually check the names of wounds and diseases that could not be coded at the time of collation of the names of the disease and disease by the conventional technique, and add them to the user dictionary as necessary.
In the registration work in the user dictionary, the wound name on the wound name master that seems to be the closest to the wound name that could not be coded is searched for and associated with the code. This operation is time-consuming and may cause variations and registration errors depending on the registered user.
In addition, when changing the code system used for code management, it is necessary to re-associate the codes with all the names of wounds in the user dictionary by using a new code system.
In this way, coding techniques using user dictionaries impose a great deal of effort on the part of the user, so code management using only the standard injury name master as much as possible improves the work efficiency as well as variations and registration errors. It can be said that it is safe from the viewpoint of prevention.
Accordingly, an object of the present invention is to provide a coding method that can easily collate more notational fluctuations with a disease name master with less burden.
Another object of the present invention is to provide an environment for evaluating the wound name and the degree of matching that are considered appropriate and presenting them to the user when there is no perfectly matched wound name as a result of the wound name master comparison. It is to provide.
Another object of the present invention is to present a plurality of wound names on the wound name master that is considered to be approximate when the user associates with a code of another wound name as a result of the evaluation, so that the user can obtain the optimal wound name. It is to provide a means for selecting.
[0004]
[Means for Solving the Problems]
In order to achieve the above object, the method of encoding a disease name according to the present invention provides:
Before collating the entered wound name with the wound name master, the notation fluctuation part on the wound name is converted into a standard notation so that the master wound name is easily detected.
In addition, in order to achieve the above object, the method of encoding a disease name according to the present invention,
When multiple wound names and modifiers are included in the input disease name string, the structure of them is analyzed and included in the wound name string based on the result. It is shown to the user whether or not encoding is possible using the name of the wound or illness.
In addition, in order to achieve the above object, the method of encoding a disease name according to the present invention,
When the user determines that another code should be associated with the input character string of the disease name, the user detects a plurality of approximate disease names of the input disease name and presents them to the user. Lets you select a code.
[0005]
DETAILED DESCRIPTION OF THE INVENTION
The encoding system which is the first embodiment of the encoding method of the present invention will be described below.
FIG. 1 is a basic configuration diagram of this embodiment. A
The
The general operation of this embodiment will be described below with reference to FIG.
First, the input character string, which is the disease name
In the example of FIG. 2, the input character string “right forearm contact dermatitis” is input as the disease name
Therefore, as in the coding method according to the present embodiment, it is more efficient to register not only the entire wound name in the user dictionary, but also to check the standard wound name master after converting only the notation fluctuation part. The risk of mistakes is reduced.
Next, the generated standardized character string is collated with the wound name master collating means 6 by the wound name master collating means 6. In the wound name master table 7, standard wound names and modifiers added to the wound names are registered as master words, and codes and phrase attributes corresponding to the respective master words are stored. The wound name master collating means 6 detects all the master words / phrases included in the standardized character string, and extracts codes and word attributes of the words / phrases.
The phrase attribute here is a parameter indicating the type of master phrase, and is used to classify whether the name is a wound name or a modifier, or what type of modifier is a modifier. In the example of FIG. 2, as a result of collating the standardized character string “right forearm contact dermatitis” with the wound name master table 7, master words “right”, “forearm”, “contact dermatitis” are detected. The attributes are “position” which is a modifier indicating position, “part” which is a modifier indicating a part of the body, and “wound and disease” indicating the name of the wound.
From the result of the master collation, it is possible to determine that the input character string of injury / illness name is the injury / illness name “contact dermatitis” including a modifier for the position and part, and the code is “6929196”. However, in general, when an input character string includes a wound name and a modifier, it cannot be determined that the wound name is a wound name corresponding to the input character string. For example, the input character string may be described as “dermatitis (contact)”. In this case, as a result of collation with the wound name master, the wound name “dermatitis” and “pathogenesis” “contact” It is detected as a modifier that indicates that it is impossible to detect the name of a consecutive “contact dermatitis”. Therefore, the code is “6869043” which means “dermatitis”. As described above, even if the disease name included in the disease name character string is encoded as it is, an appropriate encoding result may not always be obtained.
Therefore, in this embodiment, whether or not the coding result is valid by using the concept of the structural formula indicating how the master words such as the names of sicknesses and modifiers included in the input character string are arranged. To evaluate.
The character string structure analyzing means 8 and the structural formula table 9 are used for the coding evaluation by the structural formula. The character string structure analyzing means 8 pays attention to the word attribute among the collation results generated by the disease name master collating means 6, arranges the word attributes corresponding to the order of the master words detected in the disease name character string, Treat as. The character string structure analyzing means 8 collates this structural formula against the structural formula table 9, and when the same structural formula is detected, the code of the wound name included in the input wound name character string from the corresponding structural evaluation. Judge whether or not can be adopted. If the same structural formula is not found, it is determined that it cannot be adopted.
In the example of FIG. 2, in the case of “right forearm contact dermatitis”, the structural formula is “positional site injury”. This structural formula is registered as “good” in the structural formula table 9 as the structural evaluation, and therefore, it is determined that the code of the wound name “contact dermatitis” included in the wound name string can be adopted. To do.
Since there are an infinite number of combinations of injury and disease name strings composed of injury and disease names and modifiers, it is difficult to evaluate whether or not each character string is properly coded. is there. However, if the disease name character strings are replaced with structural formulas as in this embodiment, most of them can converge to about several hundred types, so if you evaluate whether it can be adopted for each structural formula, most of the sick name characters It can be determined whether the column can be automatically encoded. Therefore, even when there is no wound name whose wound name matches the wound name master, the user can narrow down the visual confirmation to the minimum.
The evaluation method for each structural formula is as follows. In general, even if a wound name and character name string includes modifiers indicating the wound name and the “position” or “part” of the body, it is considered that these modifiers have little influence on the wound name. For example, even if “right forearm contact dermatitis” is “left lower leg contact dermatitis”, it is still “contact dermatitis”. However, if the included modifiers indicate "etiology" or "condition", these wound names may be expressed in another standard wound name, so they are included in the wound name string. It is not always possible to adopt the names of wounds and diseases. Also, if multiple wound names are detected in the wound name string, it is difficult to determine whether it is just an enumeration of wound names or whether two wound names represent a single meaning. Requires visual confirmation.
Presentation of the coding result evaluation by the structural formula and visual confirmation by the user are performed by the collation
For the correction of the encoded result, the approximate wound name search means 10 and the approximate wound name table 11 are used. The approximate wound name search means 10 performs a fuzzy search in the approximate wound name table 11 for the standardized character string already generated by the notation fluctuation standardization means 4, and extracts a plurality of wound names and codes that approximate the standardized character string. To do. This fuzzy search result is again presented to the user by the
According to the prior art, this approximate disease name search operation is performed by the user, and the user searches for an appropriate disease name based on the correspondence table between the disease name and the code, and encodes it by inputting the code. It was. However, this method places a heavy burden on the user's search work, and even if there is a more appropriate name for the disease, the code for another disease name is registered, or an incorrect code is registered due to an input error when entering the code. There was a risk of doing so. In this embodiment, structural evaluation is performed in advance, the minimum necessary input character string that requires visual confirmation is extracted, and the change of the code by the user is performed by selecting the most appropriate wound name from a plurality of approximate wound names. Therefore, it is possible to significantly reduce the burden of coding work by the user and to suppress coding errors due to input mistakes to the maximum.
As described above, according to the present embodiment, it is possible to provide an encoding system that can accurately encode an input character string with fluctuation in notation with less user work load.
Hereinafter, the notation fluctuation standardization means 4 and the notation fluctuation table 5 of this embodiment will be described in detail with reference to FIGS.
FIG. 3 is a diagram showing a specific example of the notation fluctuation table 5 of the present embodiment. The notation fluctuation table 5 stores at least a fluctuation word / phrase 301 that is a variation of conventional notation and kana usage, and a standard word /
The purpose of the notation fluctuation table 5 is to converge the notation fluctuations of various wound names described at the discretion of the doctor to the notation of the master word / phrase stored in the wound name master table 7. Thus, fluctuations in phrases often include variations in notation commonly used in sickness names, such as idiomatic notation (“skin” and “skin-fu”), hiragana / katakana / kanji notation (“biran”, “bilan”, “糜爛” )), Differences in kanji (“neck” and “neck”), pronunciation differences (“virus” and “virus”), presence / absence of long sound symbols (“Qatar” and “catar”), etc. 7 together with a standard word / phrase which is a standard notation registered in 7.
FIG. 4 is a flowchart showing the detailed operation of the notation fluctuation standardization means 4.
First, in
Next, in
If a corresponding fluctuation word is found, the fluctuation word part is replaced with a word stored in the standard word /
The conversion is not necessarily part of the input character string, and the entire input character string is converted into a standard phrase as a fluctuation phrase, or a fluctuation phrase is not detected in the input string and is controlled as a standardized phrase as it is It may be returned to the
As described above, the notation fluctuation standardization means 4 and the notation fluctuation table 5 standardize the notation fluctuation included in the input character string, and more collation name character strings are used when collating with the wound name master table 6 as the next step. Can be coded.
Compared with the method of storing the disease name character string including notation fluctuation in the user dictionary and the corresponding code as in the conventional technique, in this embodiment, only the notation fluctuation is standardized on the character string, so in the next step It does not depend on the wound name master table 7 to be used.
In other words, when changing the code system used in the disease name master table 7, the user dictionary must change the codes of all registered disease name character strings based on the new code system. It is not dependent on the coding system. Therefore, it is possible to avoid a huge work load that rewrites all the codes in the user dictionary.
Hereinafter, the wound name
FIG. 5 is a diagram showing a specific example of the wound name master table 7 in the present embodiment. The wound name / master name table 7 stores at least a master word /
Commonly used codes are the disease name master and modifier master of the receipt computer processing system whose main purpose is to encode the names of wounds and diseases described in the receipt, and many disease names and modifiers are coded. ing. If too many types of codes are used, such as when analyzing disease trends based on the names of wounds and sicknesses, the classification is too fine and 119 items are coded with a large number of wound names. The disease classification (medium classification code) for social insurance charts is often used. As described above, it is preferable that the user can select the code depending on the purpose of use. If a plurality of code systems are stored in the sickness name master table 7, an appropriate code system can be selected according to the user's purpose of use. .
FIG. 6 is a table showing an example of the
FIG. 7 is a flowchart showing the detailed operation of the wound name master collating means 6.
First, in
In
If a corresponding word is detected in
In
FIG. 8 is a table for explaining rules for selecting only a master word / phrase necessary in
If the relationship between the master word / phrase A and the master word / phrase B is included in the other word / phrase as in 1) to 3) in FIG. 8, the longer master word / phrase is selected. For example, “forearm” is selected for “forearm” and “front”.
If the master phrase A and the master phrase B do not overlap at all in the input character string as shown in 4) of FIG. 8, both are independent master phrases and are selected.
As shown in 6) to 8) of FIG. 8, when the master phrase A and the master phrase B are shifted in the front and back and are arranged in the input character string, the master phrase A or the master phrase B having the larger number of characters is selected. However, only when the number of characters is the same, the one shifted backward as in 6) is selected.
FIG. 9 is a diagram illustrating the state of the collation table 15 before and after the necessary master word / phrase is selected in
In FIG. 9, as an example, it is assumed that a wound name character string “possibility of right forearm contact dermatitis” is input to the wound name
After that, in
As described above, the code of each master word / phrase included in the input character string of injury / illness name is acquired by the injury / patient name master collating means 6 and the injury / illness name master table 7. In addition, by acquiring the phrase attribute, the character string structure analyzing means 8 which is the next step can perform the structure analysis, and the encoding result can be evaluated.
Hereinafter, the character string structure analyzing means 8 and the structural formula table 9 of this embodiment will be described in detail with reference to FIGS.
FIG. 10 is a diagram showing a specific example of the structural formula table 9 in the present embodiment. The structural formula table 9 stores at least a
The
FIG. 11 is a flowchart showing the detailed operation of the character string structure analyzing means 8.
First, in
In
If the same structural formula is detected in the structural formula table 9 in
If the same structural formula is not detected in
As described above, by using the structural formula that is an array of the phrase attributes of the master phrase included in the input disease name character string by the character string
It is possible to automatically perform a series of processes for standardizing the fluctuation of the notation of the character string of the disease name input as described above, obtaining a code by master verification, and evaluating a coded result by structure evaluation. Therefore, even if a large number of disease name strings are entered, the user browses the display screen after the automatic processing of all the disease name strings, and visually checks only the disease name character strings that cannot be automatically encoded by the structure evaluation, Other codes can be rewritten as needed.
The collation
FIG. 12 is a diagram showing a specific example of the encoding result storage table 13 in the present embodiment.
The disease name character strings inputted one after another are coded through each process and accumulated in the coded result storage table 13. The items stored in the encoding result storage table 13 are an
Subsequently, the
In FIG. 12, in order to improve the legibility of the
FIG. 13 is a specific example of a screen displayed on the
This screen is for presenting the encoded result stored in the encoded result storage table 13 and its evaluation to the user and prompting the user to determine whether or not correction by the user is necessary.
A
A
In this way, the user can browse only the input character string that seems to be corrected based on the screen displayed by the collation
As an example of the approximate character string search in the present embodiment, there is an ambiguous search method using N-grams often used in natural language processing. In general, a character string of length N adjacent in a phrase or sentence is called an N-gram. For example, one gram of the character string “myocardial infarction” is “heart”, “muscle”, “infarction”, and “block”. Gram is “myocardium”, “muscle infarction”, “infarct”. In this way, if the character string is decomposed into grams and the master table is also stored with the master word / phrase decomposed into grams, the larger the number of grams in both, the closer the character strings of both. You can see that Of course, all the grams match if they are the same string. However, even if some letters are missing or the word order is reversed, many grams match. Judge that there is.
The approximate wound name search means 10 and the approximate wound name table 11 in this embodiment will be described in detail below with reference to FIGS.
FIG. 14 is a diagram showing a specific example of the approximate disease name table 11 of the present embodiment.
The approximate word / phrase name table 11 stores master words / phrases stored in the disease / disease name master table 7 in a state of being decomposed into grams, and each word / phrase
In the example of FIG. 14, 1 gram and 2 gram of “myocardial infarction” of master word /
In N-grams, the accuracy of the fuzzy search varies depending on the length N of the character string, but in searching for sickness names, both 1 and 2 are used because of the balance between the search accuracy and the capacity of the table. Just right. Of course, you can use more than 3 grams.
The master phrase for storing the gram in the approximate disease name table 11 does not have to be all the master words stored in the disease name master table 7, and the purpose of the search is to search for the disease name. It is also possible to reduce the number of options and make it easy to select only a certain wound name or a typical wound name. FIG. 15 is a flowchart showing the detailed operation of the approximate disease name search means 10. When the input character string selected by the user on the screen shown in FIG. 13 is instructed to search for an approximate disease name,
In
Here, it can be said that the more grams match, it can be said that the name of the wound is approximate, but in this embodiment, as the matching rate that quantitatively indicates the degree of approximation of both,
(Number of matched grams) ÷ (number of grams of master phrase)
Is used.
The master word / phrase in which the gram match is found is passed to the collation
In
FIG. 16 is a specific example of a screen displayed on the
The approximate wound name search result that is the result of the fuzzy search using the gram is displayed in the list on the lower right of the screen, and the candidate wound
Of the items displayed in the list,
Also, by displaying the candidate wound names from the top in the order of high relevance rate, the user can examine the candidate wound names in descending order of coincidence, thereby facilitating selection.
Here as the precision
(Number of matched grams) ÷ (number of grams of master phrase)
Use
(Number of matched grams) ÷ (Number of grams in standardized character string)
The reason for not using is that the order of coincidence between the two is different.
In the former case, for example, when “contact dermatitis” is searched, “contact dermatitis” and “dermatitis” are also displayed at the top of the list with a
In general, when searching for a wound name is not found, if the exact wound name is not found, the name of the wound that broadly captures the wound name, that is, “dermatitis” for “contact dermatitis”, “acute bronchitis” "It is natural to choose" bronchitis ".
Accordingly, by using the former relevance rate, it is possible to evaluate that the relevance rate is higher for a disease name that broadly captures the name of the disease, and it is possible to present candidate disease names with priority orders suitable for the user's selection work.
When the user finds an appropriate wound name from the list by the approximate wound name search by the automatic coding process, the candidate wound name is selected and the “adopt”
In order to obtain the code of the disease name string by the approximate disease name search, the user selects the most appropriate one from among tens of thousands of standard injury names as in the conventional technique, and inputs the code by punch input or the like. On the other hand, it is much easier and the effect of preventing erroneous registration due to an input error is high.
In addition, even if an appropriate code cannot be found, it is possible to easily extract the name of the disease and sickness that captures the character string of the disease and disease in a broad sense, so there is little variation in the coding results due to differences in user knowledge and experience, and anyone can It is possible to obtain roughly similar coding results. The consistency of the encoded results is important for statistical analysis because it can prevent differences in results due to differences in interpretation when compared with other disease trend analysis results.
FIG. 17 is a diagram showing a specific example of the coding result storage table 13 after the approximate injury / illness name search in this embodiment.
Here, as a result of an approximate wound name search for “asthmatic bronchitis”, “olfactory dysfunction”, and “tonsillitis (chronic)” in the
In the approximate wound name search, various character strings of wound names can be encoded. For example, in FIG. 17, "asthmatic bronchitis" (bronchitis with asthma-like symptoms) and "asthmatic bronchitis" (bronchi due to asthma) Injury and disease names that have similar meanings such as “flame”, broader names such as “olfactory dysfunction” and “sensory disturbance”, and word order notation such as “tonsillitis (chronic)” and “chronic tonsillitis” Can be easily coded.
The coding results stored in the coding result storage table 13 can be output to the outside of the
The maintenance screens for various tables in this embodiment will be described below with reference to FIGS. 18 and 19.
FIG. 18 is a diagram showing a specific example of the maintenance screen of the notation fluctuation table 5.
The maintenance screen includes a list that lists words stored in the notation fluctuation table 5, and at least a
While viewing this list, the user adds a new fluctuation phrase and standard phrase using the
In order to efficiently encode the disease name character string input at any time, it is preferable to always maintain the optimum state of the notation fluctuation table. Therefore, if there is a poor coding result due to a new notation fluctuation, add a new fluctuation phrase, standard phrase, or if the previously registered fluctuation phrase and standard phrase are rarely used thereafter, Deleting it reduces the verification load and enables faster conversion. The number of
FIG. 19 is a diagram showing a specific example of the maintenance screen of the structural formula table 9.
On the maintenance screen, there is a list that lists the structural formulas stored in the structural formula table 9, and at least the
While viewing this list, the user can add a new structural formula with the
The structural formula is an index used for evaluating the coding result in this embodiment. When a new structural formula is added or the structural evaluation is not intended by the user, the structural evaluation is adjusted on this maintenance screen. There is a need to do.
The encoding system according to the second embodiment of the encoding method of the present invention will be described below with reference to FIGS.
In the above-described embodiment of the present invention, when the user determines that the result of the automatic coding by the master verification is not appropriate, the user needs to perform an approximate wound name search and convert it to an appropriate code each time. In this case, when the same disease name character string is input, the user is burdened with the same processing.
In the configuration diagram of this embodiment shown in FIG. 20, in addition to the above-described embodiment of FIG. 1, conversion history recording means 18, conversion history search means 19, and conversion history table 20 are provided.
As a result of being automatically encoded and determined to be adopted by the user, or as a result of a search for an approximate disease name by the user, an input disease name character string, standardized character string, code A, stored in the encoded result storage table 13 Code B, code A string, structural formula, structural evaluation, and comment are stored in the conversion history table by the conversion history recording means 18.
In the present embodiment, when a disease name character string is input, the
When the same input character string is detected, the conversion history search means 19 returns the information in the table to the control means 14, and the control means 14 records it in the encoded result storage table 13 via the matching result correction means 12. .
According to the present embodiment, the encoding result once adopted by the user and stored in the encoding result storage table 13 is stored in the conversion history table 20, and when the same injury name character string is input next time, Since the conversion history table 20 is registered in the encoding result storage table 13, various processes in the middle can be omitted. Therefore, particularly when a large number of injury / sickness name character strings are input and many of the same injury / sickness name character strings are included therein, the processing speed can be remarkably improved.
FIG. 21 is a specific example of a screen displayed on the
FIG. 21 is a display screen of an approximate injury / illness name search result similar to FIG. 16 of the above-described embodiment. In FIG. 21, a
The encoding system according to the third embodiment of the encoding method of the present invention will be described below with reference to FIGS.
FIG. 22 is a block diagram of the present embodiment, and in this embodiment, the
In the present embodiment, since various medical information other than the disease name character string is obtained at the time of encoding, it is possible to refer to such information at the time of visual confirmation and code correction by the user.
FIG. 23 is a specific example of a screen displayed on the display means 18 in the present embodiment. The
The user confirms the encoding result using the collation result display screen 2301, and refers to the medical treatment
The main points of the present invention are summarized as follows.
When an input character string is encoded by master collation, a phrase having a notation fluctuation in the character string is converted into a standard phrase in advance.
Further, in order to convert a phrase having notation fluctuation in the input character string into a standard phrase, the notation fluctuation phrase and the standard phrase are stored in the storage area as a pair.
Furthermore, a display screen for editing a pair of a phrase having a notation fluctuation and a standard phrase stored in the storage area is provided.
When the input character string is encoded by master collation, one or more words / phrases registered in the character string are detected, and an array of the word / phrase attributes is generated. Evaluate whether or not.
Further, the phrase, code and attribute are stored in the storage area.
Further, the phrase attribute and the structure evaluation indicating whether or not encoding is possible are stored in the storage area. Furthermore, it has a display screen for editing the array of phrase attributes and the structure evaluation stored in the storage area.
Furthermore, when the input character string and the encoded result are displayed, only the input character string that needs to be corrected can be displayed as a result of the evaluation.
Further, as a result of the evaluation, if correction is necessary, a screen for performing a fuzzy search from this screen is displayed.
The input character string and the encoded result are stored in the storage area, and the next time the same character string is input, the encoded result is output.
Furthermore, it has a display screen which can select whether to store the input character string and the encoded result in the storage area.
When the input character string and the encoded result are displayed, the form data or image that is the basis of the input character string is displayed together.
[0006]
【The invention's effect】
As described above, the encoding method of the present invention takes time and effort to register all names of wounds and sickness including notation fluctuations of various wound names as in the prior art when coding the names of wounds and sickness. Since there is no need to perform work that is prone to mistakes, the work efficiency and the reliability of code output are greatly improved.
In addition, according to the present invention, as in the prior art, all the names of wounds and sickness that were not detected at the time of matching with the name of the sickness were confirmed by human eyes, and it was necessary to add them to the user dictionary as necessary. By automatically evaluating the encoding result and presenting it to the user, there is an effect that minimum visual confirmation and correction work can be performed according to the user's needs and applications.
In addition, according to the present invention, when coding a disease name that has not been detected at the time of disease name master matching as in the prior art, a code must be directly input by punch input or the like. By selecting the most appropriate approximate disease name, the user records the code, so that the work efficiency and the reliability of code output are greatly improved.
[Brief description of the drawings]
FIG. 1 is a basic configuration diagram showing an embodiment according to the present invention.
FIG. 2 is a process flow diagram illustrating one embodiment according to the present invention.
FIG. 3 is a diagram illustrating an example of a notation fluctuation table.
FIG. 4 is a flowchart of notation fluctuation standardization means.
FIG. 5 is a diagram showing an example of a wound name master table.
FIG. 6 is an explanatory diagram showing types of word attributes.
FIG. 7 is a flowchart of the disease name master collating means.
FIG. 8 is an explanatory diagram showing a selection rule when a plurality of master words / phrases are detected.
FIG. 9 is an explanatory diagram showing the behavior of a collation table.
FIG. 10 is a diagram showing an example of a structural formula table.
FIG. 11 is a flowchart of character string structure analysis means.
FIG. 12 is a diagram showing an example of a coding result storage table after automatic processing.
FIG. 13 is a diagram showing an example of a coding result display screen in the collation result correcting unit after automatic processing.
FIG. 14 is a diagram showing an example of an approximate wound name table.
FIG. 15 is a flowchart of approximate wound name search means.
FIG. 16 is a diagram showing an example of a coding result display screen in the matching result correcting means at the time of approximate disease name search.
FIG. 17 is a diagram showing an example of a coding result storage table after an approximate injury / illness name search.
FIG. 18 is a diagram showing an example of a maintenance screen example of a notation fluctuation table.
FIG. 19 is a diagram showing an example of a maintenance screen of a structural formula table.
FIG. 20 is a basic configuration diagram showing a second embodiment according to the present invention.
FIG. 21 is a diagram showing an example of a coding result display screen in the matching result correcting unit after the approximate injury / illness name search in the second embodiment according to the present invention.
FIG. 22 is a basic configuration diagram showing a third embodiment according to the present invention.
FIG. 23 is a diagram showing an example of a display screen in the third embodiment according to the present invention.
[Explanation of symbols]
1. Computer device
2 ... Injury name string data
3 ... Wound and disease name coding result data
4 ... Notation fluctuation standardization means
5 ... Notation fluctuation table
6 ... Injury and disease name master verification means
7… Injury and disease name master table
8 ... Character string structure analysis means
9 ... Structural formula table
10 .... Approximate wound name search means
11 ... Approximate wound name table
12 ... Verification result correction means
13 ... Encoded result storage table
14 ... Control means
15 ... Collation table
16: Display means
17 ... Input means
18. Conversion history recording means
19 ... Conversion history search means
20 ... Conversion history table
21 ... Medical information database.
Claims (2)
前記標準語句に変換された前記入力文字列を標準化文字列として、傷病名マスタテーブルに照合し、該標準化文字列に含まれる傷病名および修飾語句をマスタ語句として検出すると共に該マスタ語句のコードを抽出する傷病名マスタ照合手段と、
前記入力文字列、標準化文字列、マスタ語句として抽出された傷病名及びそのコードを提示する表示手段と、
前記入力文字列又は前記標準化文字列をグラム分解した語句を、前記傷病名マスタテーブルに格納されたマスタ語句をグラム分解した語句が格納された近似傷病名テーブルと照合してマスタ語句毎に一致したグラム数を集計し、前記マスタ語句のグラム数に対する前記一致したグラム数の割合を適合率として用い、前記適合率に基づいて前記マスタ語句を表示させる近似傷病名検索手段を有することを特徴とするコード化システム。A notation fluctuation standardization means for collating an input character string with a notation fluctuation table, detecting a fluctuation word / phrase in the input character string and converting it to a corresponding standard word / phrase;
The input character string converted into the standard phrase is collated with a wound name master table as a standardized character string, and the wound name and modifier included in the standardized string are detected as a master phrase, and the code of the master phrase is A disease name master collating means to be extracted;
Display means for presenting the input character string, the standardized character string, the wound name extracted as a master word and its code,
The phrase obtained by gram-decomposing the input character string or the standardized character string is compared with the approximate disease name table in which the phrase obtained by gram-decomposing the master word stored in the disease name master table is matched for each master word / phrase. It has an approximate disease name search means for counting the number of grams, using the ratio of the number of matched grams to the number of grams of the master phrase as a precision, and displaying the master phrase based on the precision. Coding system.
コンピュータに、入力文字列を前記表記ゆらぎテーブルに照合して該入力文字列内のゆらぎ語句を検出し対応する標準語句に変換し、前記標準語句に変換された前記入力文字列を標準化文字列として、傷病名マスタテーブルに照合し、該標準化文字列に含まれる傷病名および修飾語句をマスタ語句として検出すると共に該マスタ語句のコードを抽出し、
前記入力文字列、標準化文字列、マスタ語句として抽出された傷病名及びそのコードを前記表示手段に提示し、前記入力文字列又は前記標準化文字列をグラム分解した語句を、前記傷病名マスタテーブルに格納されたマスタ語句をグラム分解した語句が格納された近似傷病名テーブルと照合してマスタ語句毎に一致したグラム数を集計し、前記マスタ語句のグラム数に対する前記一致したグラム数の割合を適合率として用い、前記適合率に基づいて前記マスタ語句を前記表示手段に提示する手順を実行させるためのプログラム。A program executed on a computer having a recording medium storing a notation fluctuation table and a sickness name master table and a display means ,
The computer collates the input character string with the notation fluctuation table, detects a fluctuation word / phrase in the input character string, converts it to a corresponding standard word / phrase, and uses the input character string converted to the standard word / phrase as a standardized character string. , Collate with the wound name master table, detect the wound name and modifier included in the standardized character string as a master phrase, and extract the code of the master phrase,
The input character string, standardized character string, wound name and disease name extracted as a master word and its code are presented to the display means, and the input character string or the phrase obtained by gram-decomposing the standardized character string is displayed in the disease name and disease name master table. The stored master word / phrase is collated with the approximate disease name table in which the words / phrases are stored, and the number of matched grams is counted for each master word / phrase, and the ratio of the number of matched grams to the number of grams of the master word / phrase is adapted. A program for executing a procedure of presenting the master word / phrase on the display unit based on the relevance ratio, which is used as a ratio.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2002056731A JP4032775B2 (en) | 2002-03-04 | 2002-03-04 | Encoding system and program |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2002056731A JP4032775B2 (en) | 2002-03-04 | 2002-03-04 | Encoding system and program |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2003256462A JP2003256462A (en) | 2003-09-12 |
| JP4032775B2 true JP4032775B2 (en) | 2008-01-16 |
Family
ID=28667167
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2002056731A Expired - Fee Related JP4032775B2 (en) | 2002-03-04 | 2002-03-04 | Encoding system and program |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP4032775B2 (en) |
Families Citing this family (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP4495431B2 (en) * | 2003-09-26 | 2010-07-07 | 株式会社湯山製作所 | ICD code assigning apparatus and method |
| JP4679955B2 (en) * | 2005-04-28 | 2011-05-11 | みずほ情報総研株式会社 | Wound and disease name coding method and wound and disease name coding program |
| JP2009245232A (en) * | 2008-03-31 | 2009-10-22 | Gengo Rikai Kenkyusho:Kk | Dedicated rule editor for generating rule definition of problem extraction from free description sentence of medical observation document |
| JP5232676B2 (en) * | 2009-02-02 | 2013-07-10 | 第一生命保険株式会社 | Payment information integration system |
| JP2010044783A (en) * | 2009-10-14 | 2010-02-25 | Yuyama Manufacturing Co Ltd | Icd code providing device |
| JP5458004B2 (en) * | 2010-12-27 | 2014-04-02 | 株式会社エヌ・ティ・ティ・データ | Registration information identification device, registration information identification method, and registration information identification program |
| JP6820528B2 (en) * | 2018-08-02 | 2021-01-27 | TXP Medical株式会社 | Electronic medical record system |
| JP7636787B2 (en) * | 2021-05-11 | 2025-02-27 | Miletos株式会社 | Expense inspection device, expense inspection method, and program |
Family Cites Families (14)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS6145361A (en) * | 1984-08-09 | 1986-03-05 | Nec Corp | Retrieving and registering system for name of disease |
| JPH03177972A (en) * | 1989-12-07 | 1991-08-01 | Nec Corp | Data base system |
| JP2500680B2 (en) * | 1990-12-13 | 1996-05-29 | 日本電信電話株式会社 | Data name assignment registration device |
| JPH04237373A (en) * | 1991-01-22 | 1992-08-25 | Toshiba Corp | Keyword input system |
| JPH04340658A (en) * | 1991-05-17 | 1992-11-27 | Hitachi Medical Corp | File retrieval method |
| JPH0676005A (en) * | 1992-08-25 | 1994-03-18 | Fujitsu Ltd | Patient disease name check method and check system |
| JPH06208575A (en) * | 1993-01-08 | 1994-07-26 | Hitachi Ltd | Disease name automatic assignment processing method and system |
| JPH09218893A (en) * | 1996-02-08 | 1997-08-19 | Sanyo Electric Co Ltd | Input device for name of disease and method therefor |
| JPH09297787A (en) * | 1996-05-07 | 1997-11-18 | Sanyo Electric Co Ltd | Master code assignment system for medical office computer |
| JP2000306023A (en) * | 1999-04-21 | 2000-11-02 | Sanyo Electric Co Ltd | Method for checking name of disease |
| JP2001028027A (en) * | 1999-07-13 | 2001-01-30 | Sanyo Electric Co Ltd | Disease name processor |
| JP2001184411A (en) * | 1999-12-27 | 2001-07-06 | Tokyo Ais:Kk | Medical fee statement check system and information recording medium |
| JP3915443B2 (en) * | 2001-06-12 | 2007-05-16 | 株式会社日立製作所 | Receipt processing system |
| JP2003122845A (en) * | 2001-10-09 | 2003-04-25 | Shinkichi Himeno | Retrieval system for medical information, and program for carrying out the system |
-
2002
- 2002-03-04 JP JP2002056731A patent/JP4032775B2/en not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JP2003256462A (en) | 2003-09-12 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US7610192B1 (en) | Process and system for high precision coding of free text documents against a standard lexicon | |
| US8670997B2 (en) | Quality metric extraction and editing for medical data | |
| US8626533B2 (en) | Patient data mining with population-based analysis | |
| US20100256991A1 (en) | Medical diagnosis support apparatus | |
| CN102184343A (en) | Report check apparatus and computer program product | |
| US20210157979A1 (en) | Systems and Methods for Extracting Form Information Using Enhanced Natural Language Processing | |
| CN103530840A (en) | Accurate and quick electronic medical record type-in system | |
| JP2003271656A (en) | Association candidate generation device, association candidate generation method, association system, association candidate generation program, and computer-readable recording medium storing the program | |
| KR102926723B1 (en) | server, method, and program capable of providing a clinical trial subject recommendation service through keyword extraction and analysis for real-world data collection | |
| JP4032775B2 (en) | Encoding system and program | |
| CN118116578A (en) | Drug recommendation method based on GPT-4 and LangChain | |
| CN119128060A (en) | A standard intelligent audit and compliance inspection method, system, terminal and medium | |
| CN113270201A (en) | Medical information data verification method and system and computer readable storage medium | |
| JP5112457B2 (en) | Prescription check device and prescription check method | |
| US20160180028A1 (en) | Information retrieval processing device and method | |
| JP4250284B2 (en) | Medical remuneration statement analysis system | |
| CN116030932A (en) | A Medication Recommendation System for Hypertension | |
| CN112699669B (en) | Natural language processing method, device and storage medium for epidemiological survey report | |
| JP3915443B2 (en) | Receipt processing system | |
| CN115688787A (en) | Medical record analysis method and device and medical record analysis system | |
| JP5206296B2 (en) | Similar sentence extraction program, method and apparatus | |
| Olensky | Data accuracy in bibliometric data sources and its impact on citation matching | |
| JP7293693B2 (en) | Information processing device and program | |
| CN118550986A (en) | A bill entry method and related device | |
| JP4679955B2 (en) | Wound and disease name coding method and wound and disease name coding program |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040616 |
|
| RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20060419 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20061226 |
|
| A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070226 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070327 |
|
| A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070521 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070626 |
|
| A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070802 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20071002 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20071015 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101102 Year of fee payment: 3 |
|
| R151 | Written notification of patent or utility model registration |
Ref document number: 4032775 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101102 Year of fee payment: 3 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111102 Year of fee payment: 4 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121102 Year of fee payment: 5 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121102 Year of fee payment: 5 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131102 Year of fee payment: 6 |
|
| LAPS | Cancellation because of no payment of annual fees |