Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP7653838B2 - Endoscope system and method of operation thereof - Google Patents
[go: Go Back, main page]

JP7653838B2 - Endoscope system and method of operation thereof - Google Patents

Endoscope system and method of operation thereof Download PDF

Info

Publication number
JP7653838B2
JP7653838B2 JP2021086545A JP2021086545A JP7653838B2 JP 7653838 B2 JP7653838 B2 JP 7653838B2 JP 2021086545 A JP2021086545 A JP 2021086545A JP 2021086545 A JP2021086545 A JP 2021086545A JP 7653838 B2 JP7653838 B2 JP 7653838B2
Authority
JP
Japan
Prior art keywords
swallowing
image
control processor
determined
test
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021086545A
Other languages
Japanese (ja)
Other versions
JP2022179218A (en
Inventor
友一 寺村
充敏 吉村
孝雄 井後
剛 小屋敷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Corp
Original Assignee
Fujifilm Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujifilm Corp filed Critical Fujifilm Corp
Priority to JP2021086545A priority Critical patent/JP7653838B2/en
Publication of JP2022179218A publication Critical patent/JP2022179218A/en
Application granted granted Critical
Publication of JP7653838B2 publication Critical patent/JP7653838B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
  • Endoscopes (AREA)

Description

本発明は、複数種類の画像解析手段を有する内視鏡システム及びその作動方法に関する。 The present invention relates to an endoscope system having multiple types of image analysis means and its operating method.

食物や飲物がうまく飲み込めなくなる状態のことを嚥下障害という。嚥下障害がある場合、食物が誤って気道に流入することによる窒息や、誤嚥性肺炎を引き起こす可能性が高くなると言われている。嚥下障害は高齢や神経系の疾患に伴って発生することから、近年の高齢化社会において嚥下機能の検査を行うことの重要性がますます高まってきている。嚥下機能の検査は、嚥下障害の治療や予防を適切に行うため、又、誤嚥の病態を特定するために行われる。 Swallowing disorders are a condition in which food and drink cannot be swallowed properly. It is said that people with swallowing disorders are more likely to choke on food accidentally entering the airway, or develop aspiration pneumonia. Because swallowing disorders occur in conjunction with aging and neurological diseases, it is becoming increasingly important to test swallowing function in today's aging society. Swallowing function tests are performed to properly treat and prevent swallowing disorders, and to identify the pathology of aspiration.

嚥下機能の検査方法として、いくつかの新しい手法が開発されつつある。例えば、特許文献1では、嚥下音を含む音声波形データを取得し、喉頭蓋閉音、食道通過音、喉頭蓋開音等の嚥下に伴う音を詳細に解析している。また、特許文献2では、3次元形状計測装置を用いて、皮膚や表層筋の動きや口角間距離の計測及び解析を行い、嚥下機能を評価している。 Several new methods are being developed for testing swallowing function. For example, in Patent Document 1, audio waveform data including swallowing sounds is acquired, and swallowing sounds such as epiglottic closure sounds, esophageal passage sounds, and epiglottic opening sounds are analyzed in detail. In addition, in Patent Document 2, a three-dimensional shape measurement device is used to measure and analyze the movement of the skin and superficial muscles and the distance between the corners of the mouth to evaluate swallowing function.

特開2016-185209号公報JP 2016-185209 A 国際公開第2018/193955号International Publication No. 2018/193955

特許文献1及び2に記載の測定方法は比較的新しい手法であり、臨床的には、X線を用いた嚥下造影検査(VF:VideoFluoroscopic examination of swallowing)、嚥下内視鏡検査(VE:VideoEndoscopic examination of swallowing)が嚥下障害の評価方法(嚥下機能評価検査)として確立されている。嚥下造影検査は、造影剤を被検体に嚥下させ、嚥下時の咽頭、喉頭、食道における放射線画像を得る検査であり、嚥下内視鏡検査は、内視鏡を経鼻的に体内に挿入し、嚥下時の咽頭及び喉頭、特に喉頭蓋周辺の内視鏡画像を得る検査である。診断を正確かつ簡便に行うため、さらに、嚥下障害の詳細な病態について情報を得るため、これらの検査で得られた画像を詳細に解析する方法が求められている。 The measurement methods described in Patent Documents 1 and 2 are relatively new techniques, and clinically, videofluoroscopic examination of swallowing (VF) and videoendoscopic examination of swallowing (VE) using X-rays have been established as methods for evaluating swallowing disorders (swallowing function evaluation tests). A videofluoroscopic examination of swallowing is an examination in which a subject swallows a contrast agent to obtain radiological images of the pharynx, larynx, and esophagus during swallowing, while a swallowing endoscopy is an examination in which an endoscope is inserted transnasally into the body to obtain endoscopic images of the pharynx and larynx, particularly the epiglottis area, during swallowing. In order to perform accurate and simple diagnosis, and to obtain information on the detailed pathology of swallowing disorders, a method for detailed analysis of the images obtained by these examinations is required.

本発明は、嚥下内視鏡検査中に得られた画像等を詳細に解析する内視鏡システム及びその作動方法を提供することを目的としている。 The present invention aims to provide an endoscope system and an operating method thereof that perform detailed analysis of images obtained during a swallowing endoscopy examination.

本発明の内視鏡システムは、被写体を照明し、被写体からの反射光を撮像し、制御用プロセッサを備え、制御用プロセッサは、検査画像を取得し、時系列的に前後する変化量が第1閾値以上の場合、検査画像に係る画像特徴量が第2閾値以上の場合、検査画像に含まれる画像特徴点の数が第3閾値以下の場合、又は、嚥下関係音を取得した場合のいずれかに該当する場合に嚥下中であると判定する。 The endoscope system of the present invention illuminates a subject, captures reflected light from the subject, and is equipped with a control processor. The control processor acquires an examination image and determines that swallowing is occurring when the amount of change over time is equal to or greater than a first threshold, when an image feature value related to the examination image is equal to or greater than a second threshold, when the number of image feature points included in the examination image is equal to or less than a third threshold, or when swallowing-related sounds are acquired.

変化量は、時系列的に前後する検査画像から単純画素値差分の絶対値を用いて求められる値であることが好ましい。 It is preferable that the amount of change is a value calculated using the absolute value of the simple pixel value difference between successive inspection images in a time series.

嚥下関係音は、制御用プロセッサが取得した音声信号を解析し、患者から発せられた音声であると判定された音声信号であることが好ましい。 It is preferable that the swallowing-related sounds are audio signals that are determined to be sounds produced by the patient by analyzing the audio signals acquired by the control processor.

制御用プロセッサは、音声信号を、嚥下関係音又は咳、ムセ、呼吸音もしくは発声のいずれかである非嚥下関係音と判定することが好ましい。 It is preferable that the control processor determines the audio signal as a swallowing-related sound or a non-swallowing-related sound, which is either a cough, choking, breathing sound or vocalization.

制御用プロセッサは、検査画像から嚥下中と判定した場合であって、かつ、非嚥下関係音が取得された場合、検査画像を非嚥下中と判定することが好ましい。 When the control processor determines from the test image that swallowing is occurring and non-swallowing related sounds are acquired, it is preferable to determine that the test image is not swallowing.

制御用プロセッサは、検査画像を分類器に入力し、嚥下中である確率を算出し、確率が第4閾値以上の場合に嚥下中と判定することが好ましい。 It is preferable that the control processor inputs the test image into a classifier, calculates the probability that swallowing is occurring, and determines that swallowing is occurring if the probability is equal to or greater than a fourth threshold.

制御用プロセッサは、検査画像と音声信号とを分類器に入力し、嚥下中である確率を算出し、確率が第4閾値以上の場合に嚥下中と判定することが好ましい。分類器は、嚥下中又は非嚥下中と判定された画像で学習されていることが好ましい。 The control processor preferably inputs the test image and the audio signal to a classifier, calculates the probability of swallowing, and determines that swallowing is occurring when the probability is equal to or greater than a fourth threshold. The classifier is preferably trained on images that have been determined to be swallowing or not swallowing.

制御用プロセッサは、嚥下中と判定された一連の検査画像を嚥下中動画、非嚥下中と判定された一連の検査画像を非嚥下中動画とした場合であって、嚥下中動画が取得された期間である嚥下連続期間の後、非嚥下中動画が取得された期間である非嚥下連続期間が一定期間を超えた場合に、一定期間を超えた非嚥下連続期間の直前の嚥下連続期間に取得された嚥下中動画を1回の嚥下動作と判定して嚥下回数をカウントすることが好ましい。 When a series of test images determined to be during swallowing is treated as a swallowing video and a series of test images determined to be during non-swallowing is treated as a non-swallowing video, and when a continuous non-swallowing period during which a non-swallowing video was acquired exceeds a certain period after a continuous swallowing period during which a swallowing video was acquired, the control processor preferably determines that the swallowing video acquired during the continuous swallowing period immediately prior to the continuous non-swallowing period that exceeded the certain period is one swallowing action and counts the number of swallows.

制御用プロセッサは、一定期間を超えた非嚥下連続期間より前の嚥下連続期間に取得された嚥下中動画と、一定期間を超えない非嚥下連続期間に取得された非嚥下中動画と、を合わせた動画を1回の嚥下動作と判定し、嚥下回数をカウントすることが好ましい。一定期間は任意に設定可能であることが好ましい。 It is preferable that the control processor determines a swallowing video acquired during a continuous swallowing period before a continuous non-swallowing period that exceeds a certain period and a non-swallowing video acquired during a continuous non-swallowing period not exceeding a certain period as one swallowing action, and counts the number of swallows. It is preferable that the certain period can be set arbitrarily.

制御用プロセッサは、時系列順に配列した検査画像のうち、1回の嚥下動作であると判定された箇所を認識可能である表示用画面を表示することが好ましい。 It is preferable that the control processor displays a display screen that enables recognition of a portion of the test images arranged in chronological order that has been determined to represent a single swallowing action.

本発明の内視鏡システムの作動方法は、制御用プロセッサを備え、被写体を照明し、被写体からの反射光を撮像する内視鏡システムの作動方法であって、検査画像を取得するステップと、時系列的に前後する検査画像間の変化量が第1閾値以上の場合、検査画像に係る画像特徴量が第2閾値以上の場合、検査画像に含まれる画像特徴点の数が第3閾値以下の場合、又は、嚥下関係音を取得した場合のいずれかに該当する場合に嚥下中であると判定するステップと、を有する。 The method of operating an endoscope system of the present invention is a method of operating an endoscope system that includes a control processor, illuminates a subject, and captures reflected light from the subject, and includes the steps of acquiring test images, and determining that swallowing is occurring when the amount of change between chronologically successive test images is equal to or greater than a first threshold, when an image feature amount related to the test image is equal to or greater than a second threshold, when the number of image feature points included in the test image is equal to or less than a third threshold, or when swallowing-related sounds are acquired.

本発明の内視鏡システム及びその作動方法によれば、嚥下内視鏡検査中に得られた画像等を詳細に解析する内視鏡システム及びその作動方法を提供することができる。 The endoscope system and operating method of the present invention can provide an endoscope system and operating method that perform detailed analysis of images and the like obtained during a swallowing endoscopy examination.

内視鏡システムの構成図である。FIG. 1 is a configuration diagram of an endoscope system. 通常光のスペクトルを示すグラフである。1 is a graph showing the spectrum of normal light. 嚥下判定部の機能を示すブロック図である。13 is a block diagram showing functions of a swallowing determination unit. FIG. 嚥下について示す説明図である。FIG. 1 is an explanatory diagram showing swallowing. 誤嚥について示す説明図である。FIG. 1 is an explanatory diagram showing aspiration. 検査画像の撮像方法について示す説明図及び画像図である。1A and 1B are explanatory diagrams and image diagrams showing a method for capturing an inspection image. 第1判定部における嚥下の判定方法を示す説明図である。FIG. 11 is an explanatory diagram showing a method for determining swallowing in the first determination unit. 第2判定部における嚥下の判定方法を示す説明図である。FIG. 11 is an explanatory diagram showing a method for determining swallowing in the second determination unit. 第3判定部における嚥下の判定方法を示す説明図である。FIG. 13 is an explanatory diagram showing a method for determining swallowing in the third determination unit. 第4判定部における嚥下の判定方法を示すフローチャートである。13 is a flowchart showing a swallowing determination method in a fourth determination unit. 嚥下判定部における検査画像及び音声信号を用いた嚥下の判定方法を示すフローチャートである。13 is a flowchart showing a swallowing determination method using a test image and a voice signal in the swallowing determination unit. 第5判定部における嚥下の判定方法を示す説明図である。FIG. 13 is an explanatory diagram showing a method for determining swallowing in the fifth determination unit. 嚥下回数カウント部に送信される検査画像について示す説明図である。13 is an explanatory diagram showing a test image transmitted to a swallowing counting unit; FIG. 嚥下回数カウント部における嚥下回数のカウント方法を示す説明図である。FIG. 13 is an explanatory diagram showing a method of counting the number of swallows in a swallowing number counter. 表示用画面を示す画像図である。FIG. 2 is an image diagram showing a display screen. 本発明の実施例について示すフローチャートである。1 is a flowchart illustrating an embodiment of the present invention.

図1に示すように、内視鏡システム10は、内視鏡12、光源装置14、プロセッサ装置15、コンピュータ16、記録装置17、ディスプレイ18、ユーザーインターフェース19、を備える。内視鏡12は、光源装置14と光学的に接続され、且つ、プロセッサ装置15と電気的に接続される。内視鏡12は、観察対象の体内に挿入される挿入部12aと、挿入部12aの基端部分に設けられた操作部12bと、挿入部12aの先端側に設けられた湾曲部12c及び先端部12dとを有している。湾曲部12cは、操作部12bのアングルノブ12eを操作することにより湾曲動作する。先端部12dは、湾曲部12cの湾曲動作によって所望の方向に向けられる。内視鏡12は、ファイバースコープであってもよく、挿入部12aの操作部側端にあってもよい。内視鏡12は、嚥下内視鏡検査に用いられる内視鏡である。 As shown in FIG. 1, the endoscope system 10 includes an endoscope 12, a light source device 14, a processor device 15, a computer 16, a recording device 17, a display 18, and a user interface 19. The endoscope 12 is optically connected to the light source device 14 and electrically connected to the processor device 15. The endoscope 12 has an insertion section 12a that is inserted into the body of an observation subject, an operation section 12b provided at the base end of the insertion section 12a, and a bending section 12c and a tip section 12d provided at the tip side of the insertion section 12a. The bending section 12c is bent by operating the angle knob 12e of the operation section 12b. The tip section 12d is directed in a desired direction by the bending operation of the bending section 12c. The endoscope 12 may be a fiberscope or may be located at the operation section side end of the insertion section 12a. The endoscope 12 is an endoscope used for swallowing endoscopy.

内視鏡12の内部には、被写体像を結像するための光学系、及び、被写体に照明光を照射するための光学系が設けられる。被写体は、嚥下運動に関係する生体内の構造である。具体的には、咽頭部及び喉頭部である。操作部12bには、アングルノブ12eの他、観察対象の静止画の取得指示に用いられる静止画像取得指示スイッチ12hと、ズームレンズの操作に用いられるズーム操作部12iとが設けられている。 Inside the endoscope 12, an optical system for forming an image of a subject and an optical system for irradiating the subject with illumination light are provided. The subject is a structure in a living body related to the swallowing movement. Specifically, it is the pharynx and larynx. In addition to the angle knob 12e, the operation unit 12b is provided with a still image acquisition command switch 12h used to command acquisition of a still image of the observation subject, and a zoom operation unit 12i used to operate the zoom lens.

光源装置14は、照明光を発生する。プロセッサ装置15は、内視鏡システム10のシステム制御及び内視鏡12から送信された画像信号に対して画像処理等を行う。ディスプレイ18は、内視鏡12で撮像した画像を表示する表示部である。ユーザーインターフェース19は、プロセッサ装置15等への設定入力等を行う入力デバイスである。 The light source device 14 generates illumination light. The processor device 15 controls the endoscope system 10 and performs image processing on image signals transmitted from the endoscope 12. The display 18 is a display unit that displays images captured by the endoscope 12. The user interface 19 is an input device that inputs settings to the processor device 15, etc.

光源装置14は、照明光を発光する光源部20と、光源部20の動作を制御する光源制御部22と、を備える。 The light source device 14 includes a light source unit 20 that emits illumination light and a light source control unit 22 that controls the operation of the light source unit 20.

光源部20は、被写体を照明する照明光を発光する。光源部20は、例えば、レーザーダイオード、LED(Light Emitting Diode)、キセノンランプ、又は、ハロゲンランプの光源を含み、少なくとも、図2に示すようなスペクトルの照明光(通常光)を発光する。白色には、内視鏡12を用いた被写体の撮像において実質的に白色と同等な、図2に示すような紫色光V、青色光B、緑色光G、又は赤色光Rを混色したいわゆる擬似白色を含む。また、光源部20は、必要に応じて、照明光の波長帯域、スペクトル、又は光量等を調節する光学フィルタ等を含む。 The light source unit 20 emits illumination light that illuminates the subject. The light source unit 20 includes a light source such as a laser diode, an LED (Light Emitting Diode), a xenon lamp, or a halogen lamp, and emits illumination light (normal light) with at least the spectrum shown in FIG. 2. The white light includes so-called pseudo-white light that is a mixture of purple light V, blue light B, green light G, or red light R as shown in FIG. 2, which is substantially equivalent to white light when imaging a subject using the endoscope 12. The light source unit 20 also includes an optical filter or the like that adjusts the wavelength band, spectrum, or light amount of the illumination light as necessary.

光源制御部22は、光源部20を構成する各光源の点灯又は消灯、及び、発光量等を制御する。内視鏡12の先端部12dには、照明光学系と撮像光学系が設けられている。光源部20が発光した照明光は、ライトガイドを介して内視鏡12に入射し、先端部12dから照明光学系の照明レンズを介して被写体に向けて出射される。撮像光学系は、対物レンズ、撮像センサを有している。照明光を照射したことによる観察対象からの光は、対物レンズ及びズームレンズを介して撮像センサに入射する。これにより、撮像センサに観察対象の像が結像される。ズームレンズは観察対象を拡大するためのレンズであり、ズーム操作部12iを操作することによって、テレ端とワイド端と間を移動する。 The light source control unit 22 controls the on/off of each light source constituting the light source unit 20, and the amount of light emitted. An illumination optical system and an imaging optical system are provided at the tip 12d of the endoscope 12. Illumination light emitted by the light source unit 20 enters the endoscope 12 via a light guide, and is emitted from the tip 12d toward the subject via an illumination lens of the illumination optical system. The imaging optical system has an objective lens and an imaging sensor. Light from the observation object as a result of irradiation with illumination light enters the imaging sensor via the objective lens and zoom lens. As a result, an image of the observation object is formed on the imaging sensor. The zoom lens is a lens for enlarging the observation object, and is moved between the telephoto end and the wide end by operating the zoom operation unit 12i.

撮像センサは、CMOS(Complementary Metal Oxide Semiconductor)センサ、CCD(Charge-Coupled Device)センサ等である。撮像センサが検知した画像信号に基づき、検査画像が生成される。 The imaging sensor may be a CMOS (Complementary Metal Oxide Semiconductor) sensor, a CCD (Charge-Coupled Device) sensor, etc. An inspection image is generated based on the image signal detected by the imaging sensor.

撮像センサには、感知した光をカラーの画像信号に変換するカラーフィルタ(ベイヤーフィルタ等)が設けられたカラー撮像センサに加えて、感知した光をモノクロの画像信号に変換するカラーフィルタが設けられていないモノクロ撮像センサを含めてもよい。なお、カラー撮像センサは、感知した光をRBG信号にするものでなく、CMY信号に変換するものとしてもよい。 The image sensor may include a color image sensor equipped with a color filter (such as a Bayer filter) that converts the sensed light into a color image signal, as well as a monochrome image sensor that does not have a color filter that converts the sensed light into a monochrome image signal. Note that the color image sensor may convert the sensed light into a CMY signal instead of an RGB signal.

カラー画像を取得する場合、画像信号には、B画素から出力されるB画像信号、G画素から出力されるG画像信号、及び、R画素から出力されるR画像信号が含まれる。画像信号はプロセッサ装置15の画像取得部31に送信され、モノクロ画像又はカラー画像である検査画像として取得される。画像取得部31で取得された検査画像は、コンピュータ16の画像入力部33に送信される。画像入力部33に送信された検査画像は、嚥下判定部40に送信される。検査画像は、内視鏡検査中に撮像された時系列的に連続した一連の動画である。 When acquiring a color image, the image signal includes a B image signal output from the B pixel, a G image signal output from the G pixel, and an R image signal output from the R pixel. The image signal is transmitted to the image acquisition unit 31 of the processor device 15, and acquired as a test image which is a monochrome image or a color image. The test image acquired by the image acquisition unit 31 is transmitted to the image input unit 33 of the computer 16. The test image transmitted to the image input unit 33 is transmitted to the swallowing assessment unit 40. The test image is a series of chronologically continuous moving images captured during an endoscopic examination.

プロセッサ装置15は、制御部30、画像取得部31、表示制御部32を含む。プロセッサ装置15においては、制御用プロセッサで構成される制御部30により、プログラム用メモリ内のプログラムが動作することで、画像取得部31及び表示制御部32の機能が実現される。 The processor device 15 includes a control unit 30, an image acquisition unit 31, and a display control unit 32. In the processor device 15, the functions of the image acquisition unit 31 and the display control unit 32 are realized by the control unit 30, which is composed of a control processor, running a program in the program memory.

コンピュータ16は、画像入力部33、嚥下判定部40、結果記録部34を含む。コンピュータ16においては、制御用プロセッサで構成される中央制御部(図示しない)により、プログラム用メモリ内のプログラムが動作することで、画像入力部33、嚥下判定部40及び結果記録部34の機能が実現される。なお、コンピュータ16及び/又は光源制御部22は、プロセッサ装置15に含まれてもよい。 The computer 16 includes an image input unit 33, a swallowing assessment unit 40, and a result recording unit 34. In the computer 16, a central control unit (not shown) consisting of a control processor runs a program in a program memory to realize the functions of the image input unit 33, the swallowing assessment unit 40, and the result recording unit 34. Note that the computer 16 and/or the light source control unit 22 may be included in the processor device 15.

以下、図3を参照しながら、嚥下判定部40の機能について説明する。嚥下判定部40は、第1判定部41、第2判定部42、第3判定部43、第4判定部44、第5判定部45、嚥下回数カウント部47を備える。嚥下判定部40は、取得された検査画像や音声が嚥下中のものであるかどうかを判定し、さらに、嚥下中、又は非嚥下中の判定を行った動画に対して1回の嚥下動作がどのタイミングで行われたかを判定し、嚥下動作の回数をカウントする。結果記録部34は、嚥下動作が行われたタイミング及び回数を記録し、ディスプレイ18に表示する画像や、記録装置17に出力する画像の生成及び動画編集を行う。 The function of the swallowing determination unit 40 will be described below with reference to FIG. 3. The swallowing determination unit 40 includes a first determination unit 41, a second determination unit 42, a third determination unit 43, a fourth determination unit 44, a fifth determination unit 45, and a swallowing count unit 47. The swallowing determination unit 40 determines whether the acquired test image or sound is during swallowing, and further determines the timing of one swallowing action for a video determined to be during swallowing or not during swallowing, and counts the number of swallowing actions. The result recording unit 34 records the timing and number of swallowing actions, and generates images to be displayed on the display 18 and images to be output to the recording device 17, and edits the videos.

嚥下とは、食物や飲物を口に入れ、咀嚼し、飲み込み、食道へ送り込む一連の動作のことを指す。図4は正常な嚥下、図5は異常な嚥下(誤嚥)についての説明図である。嚥下運動は、図4に示すように、食物Fを主に舌Toの運動により口腔から咽頭へ運ぶ「口腔期」、食物Fを嚥下反射により咽頭から食道Esへ運ぶ「咽頭期」、食物Fを食道の蠕動運動により食道Esから胃へ運ぶ「食道期」に分けられる。嚥下の際は、食物Fを食道Esへ向かわせて気管Trへ流入させないため、気管Trに蓋をする役割を担う喉頭蓋Egが、反射運動により気管Trの入り口(声門)を閉鎖する。また、口腔の天井である軟口蓋Spも後方へ移動して口腔と鼻腔の通路を閉鎖し、食道Fが鼻腔へ侵入しないようにする。口腔期、咽頭期、食道期のいずれかのタイミングにおいて何らかの機能障害が起こった場合、図5のように、正常であれば食道Esに輸送されるはずの食物Fが気管Trに流入することを誤嚥という。 Swallowing refers to a series of actions that involves putting food or drink into the mouth, chewing, swallowing, and sending it down the esophagus. Figure 4 is an explanatory diagram of normal swallowing, and Figure 5 is an explanatory diagram of abnormal swallowing (aspiration). As shown in Figure 4, the swallowing movement is divided into the "oral stage" in which food F is transported from the oral cavity to the pharynx mainly by the movement of the tongue To, the "pharyngeal stage" in which food F is transported from the pharynx to the esophagus Es by the swallowing reflex, and the "esophageal stage" in which food F is transported from the esophagus Es to the stomach by the peristaltic movement of the esophagus. When swallowing, the epiglottis Eg, which serves to cover the trachea Tr, closes the entrance (glottis) of the trachea Tr by a reflex movement to direct food F towards the esophagus Es and prevent it from flowing into the trachea Tr. In addition, the soft palate Sp, which is the roof of the oral cavity, also moves backwards to close the passage between the oral cavity and the nasal cavity, preventing the esophagus F from entering the nasal cavity. If some kind of functional disorder occurs during the oral, pharyngeal, or esophageal phase, food F that would normally be transported to the esophagus Es will flow into the trachea Tr, as shown in Figure 5. This is called aspiration.

図5の誤嚥の例1は、口腔期から咽頭期にかけ、嚥下反射が起こる前に気管Trに食物Fが流入する誤嚥の例である。図5の誤嚥の例2は、咽頭期から食道期にかけ、嚥下反射の中途において喉頭蓋Egによる声門(気管Trの入口)の閉鎖が不完全なことで気管Trに食物Fが流入する誤嚥の例である。図5の誤嚥の例3は、喉頭蓋谷Evや、食道の入口の左右に存在する窪みである梨状陥凹(図6の検査画像の例100を参照)に残留した食物Fが、嚥下反射後に気管Trに流入する誤嚥の例である。 Example 1 of aspiration in FIG. 5 is an example of aspiration in which food F flows into the trachea Tr before the swallowing reflex occurs from the oral to pharyngeal phase. Example 2 of aspiration in FIG. 5 is an example of aspiration in which food F flows into the trachea Tr due to incomplete closure of the glottis (the entrance to the trachea Tr) by the epiglottis Eg halfway through the swallowing reflex from the pharyngeal to esophageal phase. Example 3 of aspiration in FIG. 5 is an example of aspiration in which food F remaining in the epiglottic vallecula Ev or the pyriform sinuses, which are depressions on the left and right sides of the entrance to the esophagus (see example 100 of the examination image in FIG. 6), flows into the trachea Tr after the swallowing reflex.

本実施形態において取得される検査画像は、内視鏡12の挿入部12aを鼻腔から咽頭へ挿入し、図6に示す中咽頭部の位置R付近に内視鏡の先端部12dが来るようにして撮像される。検査画像には、図6の検査画像の例100に示すように、喉頭蓋Eg、声門裂Rg、左右の梨状陥凹Ps等の解剖学的構造が含まれることが好ましい。声門裂Rgとは、声帯を構成する左右のヒダの間の空間のことである。以下はこの中咽頭部に内視鏡先端を配置する場合について説明するが、これ以外にも鼻咽腔部、上咽頭部、下咽頭部、又は喉頭部に配置して嚥下の判定を行ってもよい。 The examination image acquired in this embodiment is captured by inserting the insertion section 12a of the endoscope 12 from the nasal cavity into the pharynx so that the tip 12d of the endoscope is located near the position R of the oropharynx shown in FIG. 6. As shown in the example examination image 100 in FIG. 6, the examination image preferably includes anatomical structures such as the epiglottis Eg, glottic cleft Rg, and left and right pyriform sinuses Ps. The glottic cleft Rg is the space between the left and right folds that make up the vocal cords. The following describes the case where the tip of the endoscope is placed in the oropharynx, but swallowing may also be judged by placing it in the nasopharynx, nasopharynx, hypopharynx, or larynx.

嚥下の判定は、第1判定部41、第2判定部42、第3判定部43、第4判定部44、又は第5判定部45のいずれか1以上において行われる。また、判定の精度を向上させるため、第1~第5判定部における判定の結果を組み合わせて嚥下の判定を行ってもよい。嚥下判定部40において行われる解析について、以下、説明する。 The swallowing judgment is performed by one or more of the first judgment unit 41, the second judgment unit 42, the third judgment unit 43, the fourth judgment unit 44, and the fifth judgment unit 45. In order to improve the accuracy of the judgment, the swallowing judgment may be performed by combining the judgment results of the first to fifth judgment units. The analysis performed by the swallowing judgment unit 40 is described below.

第1判定部41は、第1の嚥下検出アルゴリズムとして、時系列的に前後する2フレームの画像に係る変化量の算出を行う。検査画像間の変化量は、時系列的に前後する検査画像から単純画素値差分の絶対値を用いて求められる値であることが好ましい。1フレーム毎の検査画像の画像中心から、縦方向及び横方向へ向かって少なくとも10ピクセル以上の領域(画像処理対象領域41g)を画像処理対象とする。図7に例示するように、時系列的に前後する前のフレームの検査画像(図7上段、検査画像41a、及び、図7下段、検査画像41d)と、後のフレームの検査画像(図7上段、検査画像41b、及び、図7下段、検査画像41e)との、画像処理対象領域41gにおける画素値の差である変化量を取る。この変化量が第1閾値以上の場合、変化量を算出した後のフレームの検査画像41eを嚥下中と判定する。第1の嚥下検出アルゴリズムは、嚥下運動に伴って被写体(特に喉頭蓋Eg付近)が激しく動くため、フレーム間の変化量が非嚥下中と比較して大きくなることを利用したものである。なお、第1閾値の値である画素値は1から255が好ましく、任意に設定できる。 The first determination unit 41 calculates the amount of change related to images of two frames that are adjacent in time series as the first swallowing detection algorithm. The amount of change between the test images is preferably a value obtained by using the absolute value of the simple pixel value difference between the test images that are adjacent in time series. An area of at least 10 pixels or more in the vertical and horizontal directions from the center of the test image for each frame (image processing target area 41g) is the target of image processing. As illustrated in FIG. 7, the amount of change is taken as the difference in pixel values in the image processing target area 41g between the test image of the previous frame that is adjacent in time series (test image 41a in the upper part of FIG. 7 and test image 41d in the lower part of FIG. 7) and the test image of the subsequent frame (test image 41b in the upper part of FIG. 7 and test image 41e in the lower part of FIG. 7). If this amount of change is equal to or greater than the first threshold, the test image 41e of the frame after the amount of change is calculated is determined to be swallowing. The first swallowing detection algorithm utilizes the fact that the subject (especially the area around the epiglottis Eg) moves vigorously during swallowing, resulting in a larger amount of change between frames compared to when not swallowing. The pixel value, which is the first threshold value, is preferably between 1 and 255, and can be set arbitrarily.

具体例について詳説する。図7の上段は、嚥下運動が起きていない前後2フレームの検査画像(前フレームの検査画像41a及び後フレームの検査画像41b)の変化量を算出した例である。嚥下運動をしていない状態では、喉頭蓋Egが開いており、声門裂Rgが容易に観察できる。また、口腔の天井である軟口蓋(図4の軟口蓋Spを参照)や喉頭蓋Egはほぼ動くことはなく、呼吸による微小な動きがある程度である。そのため、内視鏡12の先端部12dの動きは少なく、図7上段の変化量の例41cに示すように、画像の全体において動きやブレはほぼ生じない。したがって、画像処理対象領域41gにおける前フレームの検査画像41aと後フレームの検査画像41bの変化量は第1閾値未満となり、後フレームの検査画像41bが非嚥下中と判定される。なお、変化量の例41cにおいては、変化量として算出された箇所を線で例示している。 A specific example will be described in detail. The upper part of FIG. 7 is an example of the calculation of the change amount of the test images of two frames (test image 41a of the previous frame and test image 41b of the following frame) before and after the swallowing movement does not occur. In the state where the swallowing movement does not occur, the epiglottis Eg is open, and the glottis Rg can be easily observed. In addition, the soft palate (see soft palate Sp in FIG. 4), which is the roof of the oral cavity, and the epiglottis Eg hardly move, and there is only a slight movement due to breathing. Therefore, the movement of the tip 12d of the endoscope 12 is small, and as shown in the example of the change amount 41c in the upper part of FIG. 7, there is almost no movement or blurring in the entire image. Therefore, the change amount between the test image 41a of the previous frame and the test image 41b of the following frame in the image processing target region 41g is less than the first threshold, and the test image 41b of the following frame is determined to be not swallowing. In the example of the change amount 41c, the part calculated as the change amount is illustrated by a line.

図7の下段は、嚥下運動が起きている前後2フレームの検査画像(前フレームの検査画像41d及び後フレームの検査画像41e)の変化量を算出した例である。嚥下運動をしている状態では、軟口蓋(図4の軟口蓋Spを参照)の移動や喉頭蓋Egによる声門裂Rgの閉鎖運動が起こるため、内視鏡12の先端部12dが激しく動き、画像の全体において大きくブレが生じることで、図7の下段の変化量の例41fに示すように、フレーム間の変化量が大きくなる。この場合、画像処理対象領域41gにおける前フレームの検査画像41dと後フレームの検査画像41eの変化量は第1閾値以上となり、後フレームの検査画像41eが嚥下中と判定される。なお、上段と同じく、変化量の例41fにおいては、変化量として算出された箇所を線で例示している。また、嚥下中はフレーム間のブレ量が大きいことから、嚥下中である下段における変化量の例41fは、非嚥下中の変化量の例41cよりも変化量を示す線が多くなっている。 The lower part of FIG. 7 shows an example of the calculated change in the test images (test image 41d of the previous frame and test image 41e of the following frame) before and after the swallowing movement. During the swallowing movement, the soft palate (see soft palate Sp in FIG. 4) moves and the epiglottis Eg closes the glottis Rg, causing the tip 12d of the endoscope 12 to move violently, resulting in a large blur in the entire image, as shown in the example of change 41f in the lower part of FIG. 7. In this case, the change between the test image 41d of the previous frame and the test image 41e of the following frame in the image processing target region 41g is equal to or greater than the first threshold, and the test image 41e of the following frame is determined to be swallowing. As in the upper part, in the example of change 41f, the calculated change is illustrated by a line. Also, because there is a large amount of blurring between frames during swallowing, the example of change in the lower row 41f, which shows the amount of change during swallowing, has more lines indicating the amount of change than the example of change during non-swallowing 41c.

第2判定部42は、第2の嚥下検出アルゴリズムとして、検査画像の画像特徴量を算出する。画像特徴量は、検査画像から算出されるエッジ量であることが好ましい。少なくとも1フレーム毎の検査画像の画像中心から、少なくとも縦方向及び横方向へ向かって10ピクセル以上の領域(画像処理対象領域42g)を画像処理対象とする。図8に例示するように、検査画像(図8上段、検査画像42a、及び、図8下段、検査画像42c)の、エッジ量検出フィルタを用いて算出される値であるVariance Of Laplacianを求め、Variance Of Laplacianから画像特徴量(図8上段、画像特徴量の例42b、及び、図8下段、画像特徴量の例42d)を算出する。画像特徴量が第2閾値以上の場合、画像特徴量を算出したフレームの検査画像を嚥下中と判定する。第2の嚥下検出アルゴリズムは、嚥下中は内視鏡12の先端が激しく動くため、ブレが大きくなることに伴い、エッジ量も大きくなることを利用したものである。なお、第2閾値の値である画素値は1から255が好ましく、任意に設定できる。画像特徴量を算出する手法としてVariance Of Laplacianを算出する手法を例示したが、他にもSobel Filter、Prewitt Filter、Canny法などのエッジ量検出フィルタを利用する方法でもよい。 The second determination unit 42 calculates the image feature of the test image as the second swallowing detection algorithm. The image feature is preferably an edge amount calculated from the test image. The image processing target is an area (image processing target area 42g) of at least 10 pixels in the vertical and horizontal directions from the image center of at least one frame of the test image. As illustrated in FIG. 8, the variance of Laplacian, which is a value calculated using an edge amount detection filter, is obtained for the test image (test image 42a in the upper part of FIG. 8 and test image 42c in the lower part of FIG. 8), and the image feature (example of image feature 42b in the upper part of FIG. 8 and example of image feature 42d in the lower part of FIG. 8) is calculated from the variance of Laplacian. If the image feature is equal to or greater than the second threshold, the test image of the frame in which the image feature was calculated is determined to be in the process of swallowing. The second swallowing detection algorithm utilizes the fact that the tip of the endoscope 12 moves vigorously during swallowing, and as the blur increases, the edge amount also increases. The pixel value, which is the second threshold value, is preferably between 1 and 255 and can be set arbitrarily. Although the method of calculating the Variance Of Laplacian has been exemplified as a method of calculating image features, other methods that use edge detection filters such as the Sobel Filter, Prewitt Filter, and Canny method may also be used.

具体例を詳説する。図8の上段は、嚥下運動が起きていない検査画像42aの画像特徴量を算出した例である。嚥下運動をしていない状態では、軟口蓋や喉頭蓋Egはほぼ動くことはないため、内視鏡12の先端部12dもほぼ動かず、図8の上段の画像特徴量の例42bに示すように、画像の全体において動きやブレはほぼ生じない。この場合、画像処理対象領域42gにおける画像特徴量は第2閾値未満となり、検査画像42aが非嚥下中と判定される。なお、画像特徴量の例42bにおいては、画像特徴量の算出対象になった箇所を線で例示している。 A specific example will be described in detail. The top part of Figure 8 is an example of calculation of image features of test image 42a when no swallowing movement is occurring. When no swallowing movement is occurring, the soft palate and epiglottis Eg hardly move, and the tip 12d of the endoscope 12 also hardly moves, and as shown in the example image feature 42b in the top part of Figure 8, there is almost no movement or blurring in the entire image. In this case, the image feature in the image processing target region 42g is less than the second threshold, and test image 42a is determined to be not swallowing. Note that in the example image feature 42b, the areas that were the subject of image feature calculation are illustrated with lines.

図8の下段は、嚥下運動が起きている検査画像42cの画像特徴量を算出した例である。嚥下運動をしている状態では、軟口蓋や喉頭蓋Egが動くことで内視鏡12の先端部12dも大きく動き、画像の全体においてブレが生じるため、図8の下段の画像特徴量の例41dに示すように、画像特徴量が大きくなる。この場合、画像処理対象領域42gにおける画像特徴量は第2閾値以上となり、検査画像42cが嚥下中と判定される。なお、上段と同じく、画像特徴量の例42dにおいては、画像特徴量の算出対象になった箇所を線で例示している。また、嚥下中はブレ量が大きいことから、嚥下中である下段における画像特徴量の例42dは、非嚥下中の例42bよりも画像特徴量を示す線が多くなっている。 The lower part of FIG. 8 shows an example of the calculation of image feature amounts of the test image 42c in which a swallowing movement is occurring. When a swallowing movement is occurring, the tip 12d of the endoscope 12 also moves significantly due to the movement of the soft palate and epiglottis Eg, and blurring occurs throughout the image, so the image feature amount becomes large, as shown in the example image feature amount 41d in the lower part of FIG. 8. In this case, the image feature amount in the image processing target region 42g is equal to or greater than the second threshold, and the test image 42c is determined to be in the process of swallowing. As in the upper part, in the example image feature amount 42d, the areas that are the subject of the calculation of the image feature amount are illustrated by lines. Also, because the amount of blurring is large during swallowing, the example image feature amount 42d in the lower part, which shows the swallowing movement, has more lines indicating the image feature amount than the example image feature amount 42b in the non-swallowing state.

第3判定部43は、第3の嚥下検出アルゴリズムとして、検査画像を線で表して抽出したエッジのうち、エッジ量が大きい角(コーナー)である度合が高い部分をキーポイントとして抽出した画像特徴点の数を算出する。少なくとも1フレーム毎の検査画像の画像中心から、少なくとも縦方向及び横方向へ向かって10ピクセル以上の領域(画像処理対象領域43g)を画像処理対象とする。図9に例示するように、検査画像(図9上段、検査画像43a、及び、図9下段、検査画像43b)から画像特徴点43cを抽出し、数を算出する。この画像特徴点43cの数が第3閾値以下の場合、画像特徴点の数を算出したフレームの検査画像を嚥下中と判定する。第3の嚥下検出アルゴリズムは、嚥下中は内視鏡12の先端が激しく動くため、ブレが大きくなることを利用したものである。なお、第3閾値の値は0以上で、任意に設定できる。また、画像特徴点の数が第3閾値以下の場合に、画素値に-1を乗算した嚥下判定値を求め、嚥下判定値が閾値未満の場合に嚥下中と判定してもよい。この場合、画像特徴点数が第3閾値を超えるときは、非嚥下中と判定する。 As a third swallowing detection algorithm, the third determination unit 43 calculates the number of image feature points extracted from the edges extracted by expressing the test image as lines, using as key points the parts with a high degree of corners with a large edge amount. The image processing target is an area of at least 10 pixels vertically and horizontally from the image center of at least one frame of the test image (image processing target area 43g). As illustrated in FIG. 9, image feature points 43c are extracted from the test image (test image 43a in the upper part of FIG. 9 and test image 43b in the lower part of FIG. 9) and the number is calculated. If the number of image feature points 43c is equal to or less than the third threshold, the test image of the frame in which the number of image feature points was calculated is determined to be in the process of swallowing. The third swallowing detection algorithm utilizes the fact that the tip of the endoscope 12 moves violently during swallowing, resulting in large blur. The value of the third threshold can be set arbitrarily to 0 or more. Also, when the number of image feature points is equal to or less than a third threshold, a swallowing determination value may be calculated by multiplying the pixel value by -1, and when the swallowing determination value is less than the threshold, it may be determined that swallowing is occurring. In this case, when the number of image feature points exceeds the third threshold, it is determined that not swallowing is occurring.

なお、特徴点抽出には、計算アルゴリズムの一種であるAKAZE(Accelarated KAZE)を用いることが好ましい。本実施形態における特徴点抽出では、画像の中のエッジ量が高い部分(「角」、「コーナー」と認識される部分)を認識することが好ましい。特徴点抽出にはScale Invariant Feature Transform(SIFT)法、Speeded-Up Robust Features(SURF)法などの他の特徴点抽出方を用いてもよい。 Note that, for feature point extraction, it is preferable to use AKAZE (Accelarated KAZE), which is a type of calculation algorithm. For feature point extraction in this embodiment, it is preferable to recognize parts in the image with a high amount of edges (parts recognized as "angles" or "corners"). For feature point extraction, other feature point extraction methods such as the Scale Invariant Feature Transform (SIFT) method and the Speeded-Up Robust Features (SURF) method may also be used.

具体例を詳説する。図9の上段は、嚥下運動が起きていない検査画像43aの画像特徴点43cの数を算出した例である。嚥下運動をしていない状態では、内視鏡12の先端部12dはほぼ動かず、画像の全体において動きやブレはほぼ生じないため、図9の上段の検査画像43aに示すように、検出される画像特徴点43cの数が大きくなる。図9の例において、第3閾値を5とすると、画像処理対象領域43gにおける画像特徴点43cの数は30であって第3閾値を超えているため、検査画像43aが非嚥下中と判定される。 A specific example will be described in detail. The top part of Figure 9 shows an example of calculating the number of image feature points 43c in an examination image 43a in which no swallowing movement is occurring. In a state in which no swallowing movement is occurring, the tip 12d of the endoscope 12 barely moves, and there is almost no movement or blurring in the entire image, so that the number of detected image feature points 43c is large, as shown in the examination image 43a in the top part of Figure 9. In the example of Figure 9, if the third threshold is set to 5, the number of image feature points 43c in the image processing target region 43g is 30, which exceeds the third threshold, and therefore the examination image 43a is determined to be not swallowing.

図9の下段は、嚥下運動が起きている検査画像43bの画像特徴点43cの数を算出した例である。嚥下運動をしている状態では、内視鏡12の先端部12dも大きく動くため、画像の全体においてブレが生じ、図9の下段の検査画像43bに示すように画像特徴点43cが検出されにくくなる。図9の例において第3閾値を5とすると、画像処理対象領域43gにおける画像特徴点43cの数は0であって第3閾値以下であるため、検査画像43bが嚥下中と判定される。 The bottom row of Figure 9 shows an example of calculating the number of image feature points 43c in test image 43b in which swallowing is occurring. When swallowing is occurring, the tip 12d of the endoscope 12 also moves significantly, causing blurring of the entire image, making it difficult to detect image feature points 43c, as shown in test image 43b in the bottom row of Figure 9. If the third threshold is set to 5 in the example of Figure 9, the number of image feature points 43c in image processing target region 43g is 0, which is less than the third threshold, and therefore test image 43b is determined to be in the process of swallowing.

第4判定部44は、第4の嚥下検出アルゴリズムとして、音声の判定を行う。プロセッサ装置15に接続されるユーザーインターフェース19には、音声を取得するマイク(図示しない)が含まれ、マイクから取得された音声波形が都度、コンピュータ16に入力される。音声波形は、音声信号として嚥下判定部40の第4判定部44に送信される。音声は、通常、検査画像とともに取得される。 The fourth determination unit 44 performs voice determination as a fourth swallowing detection algorithm. The user interface 19 connected to the processor device 15 includes a microphone (not shown) that acquires voice, and the voice waveform acquired from the microphone is input to the computer 16 each time. The voice waveform is transmitted as an audio signal to the fourth determination unit 44 of the swallowing determination unit 40. The voice is usually acquired together with the test image.

音声の判定方法について、図10のフローチャートを用いて説明する。まず、第4判定部44に音声信号が入力される(ステップS101)。第4判定部44は、入力された音声信号を解析し、まず、患者から発せられた音声であるか、患者以外から発せられた音声であるかを判定する(ステップS102、ステップS103)。音声信号が患者以外から発せられた音声である場合、検査時刻(検査時間)とともに記録される。音声信号が患者から発せられた音声である場合、音声信号が嚥下関係音であるか、非嚥下関係音であるかを判定する(ステップS104)。嚥下関係音とは、飲み込み音や嚥下に伴う喉頭蓋開閉音等のことである。非嚥下関係音とは、咳、ムセ、発声、呼吸音等の音である。音声信号が嚥下関係音である場合、嚥下中であると判定する(ステップS105)。嚥下関係音でない場合、非嚥下中であると判定する(ステップS106)。 The method of determining the voice will be described with reference to the flowchart of FIG. 10. First, a voice signal is input to the fourth determination unit 44 (step S101). The fourth determination unit 44 analyzes the input voice signal and first determines whether the voice is from the patient or from someone other than the patient (steps S102 and S103). If the voice signal is from someone other than the patient, it is recorded together with the examination time (examination time). If the voice signal is from the patient, it is determined whether the voice signal is a swallowing-related sound or a non-swallowing-related sound (step S104). Swallowing-related sounds include swallowing sounds and epiglottis opening and closing sounds associated with swallowing. Non-swallowing-related sounds include sounds such as coughing, choking, vocalization, and breathing sounds. If the voice signal is a swallowing-related sound, it is determined that swallowing is in progress (step S105). If the voice signal is not a swallowing-related sound, it is determined that non-swallowing is in progress (step S106).

第1判定部41、第2判定部42、第3判定部43及び第5判定部45が嚥下中と判定した検査画像であっても、その検査画像が取得されたタイミングで取得された音声信号について第4判定部44が非嚥下中と判定した場合は、その検査画像を非嚥下中であると判定する。すなわち、咳、ムセ、発声等により喉頭部や声帯が嚥下と同様に大きく動く場合においては、第1判定部41、第2判定部42、第3判定部43及び後述する第5判定部45では検査画像から嚥下中と判定されるが、検査画像から嚥下中と判定された場合でも、第4判定部44が非嚥下関係音を取得した場合は非嚥下中と判定する。 Even if the first judgment unit 41, the second judgment unit 42, the third judgment unit 43, and the fifth judgment unit 45 judge the test image to be during swallowing, if the fourth judgment unit 44 judges the test image to be during non-swallowing based on the audio signal acquired at the time the test image was acquired, the test image is judged to be during non-swallowing. In other words, if the larynx or vocal cords move significantly as in swallowing due to coughing, choking, speaking, etc., the first judgment unit 41, the second judgment unit 42, the third judgment unit 43, and the fifth judgment unit 45 described below judge the test image to be during swallowing, but even if the test image judges the test image to be during swallowing, if the fourth judgment unit 44 acquires non-swallowing-related sounds, it is judged to be during non-swallowing.

嚥下中と判定された検査画像と音声信号を用いた判定方法について、図11のフローチャートを用いて説明する。まず、第1判定部41、第2判定部42、第3判定部43又は後述する第5判定部45が検査画像を嚥下中と判定する(ステップS201)。これとともに、第4判定部44に音声信号が入力される(ステップS202)。次に、第4判定部44が音声信号を嚥下関係音であるか、非嚥下関係音であるかを判定する(ステップS203)。音声信号が嚥下関係音である場合、嚥下中であると判定する(ステップS204)。嚥下関係音でない場合、非嚥下中であると判定する(ステップS205)。上記構成により、画像のみでは嚥下反応か嚥下以外の反応かを判別できない場合、例えば、咳に伴う声門の閉鎖や喉頭蓋の開閉等、嚥下ではないが声門や喉頭蓋の動きが大きくなる場合に、音声データを用いることでこれらの嚥下以外の反応を除外することで、嚥下中又は非嚥下中の判定の精度を向上させることができる。 A method of determination using a test image determined to be swallowing and an audio signal will be described with reference to the flowchart of FIG. 11. First, the first determination unit 41, the second determination unit 42, the third determination unit 43, or the fifth determination unit 45 described below determines that the test image is being swallowed (step S201). At the same time, an audio signal is input to the fourth determination unit 44 (step S202). Next, the fourth determination unit 44 determines whether the audio signal is a swallowing-related sound or a non-swallowing-related sound (step S203). If the audio signal is a swallowing-related sound, it is determined that swallowing is occurring (step S204). If the audio signal is not a swallowing-related sound, it is determined that non-swallowing is occurring (step S205). With the above configuration, when it is not possible to distinguish between a swallowing response and a non-swallowing response based on images alone, for example when there is significant movement of the glottis or epiglottis that is not swallowing, such as the closing of the glottis or the opening and closing of the epiglottis associated with coughing, the accuracy of determining whether swallowing or not is improved by using voice data to exclude these non-swallowing responses.

また、第4判定部44は、嚥下関係音及び非嚥下関係音と、嚥下関係音及び非嚥下関係音が発せられたタイミングにおける検査画像とを対応付けてもよい。さらに、嚥下関係音及び非嚥下関係音が発生したタイミングにおいて、正常、又は異常(嚥下障害)である鑑別を行い、検査画像と対応付けてもよい。嚥下関係音及び非嚥下関係音に関連する正常又は異常の鑑別は、具体的には、嚥下関係音及び非嚥下関係音の回数、嚥下関係音及び非嚥下関係音が複数回発せられた場合はどのような間隔で発せられたか、嚥下に伴う喉頭蓋開閉音は嚥下障害に関係するものであるかどうか等の解析を行った上で行う。 The fourth determination unit 44 may also associate the swallowing-related sounds and non-swallowing-related sounds with the test image at the timing when the swallowing-related sounds and non-swallowing-related sounds are produced. Furthermore, the timing when the swallowing-related sounds and non-swallowing-related sounds are produced may be differentiated as normal or abnormal (dysphagia), and associated with the test image. Specifically, the normal or abnormal differentiation related to the swallowing-related sounds and non-swallowing-related sounds is performed after analyzing the number of swallowing-related sounds and non-swallowing-related sounds, the intervals at which swallowing-related sounds and non-swallowing sounds are produced if they are produced multiple times, whether the epiglottis opening and closing sounds associated with swallowing are related to dysphagia, etc.

なお、音声信号が患者以外から発せられた音声である場合、医師等の発する特定の音声(例えば、「検査開始」等の呼びかけ)であると判定した場合、特定の音声と、特定の音声が発せられたタイミングにおける検査画像とを対応付けてもよい。 In addition, if the audio signal is a voice emitted by someone other than the patient, and it is determined to be a specific voice emitted by a doctor or the like (for example, a call such as "start the examination"), the specific voice may be associated with the examination image at the time the specific voice was emitted.

第5判定部45は、検査画像を入力すると、嚥下中である確率を算出し、嚥下中か否かを判定する分類器45aが搭載されることが好ましい。分類器45aは、機械学習を用いて生成した分類器である。機械学習には深層学習を用いることが好ましく、例えば多層畳み込みニューラルネットワークを用いることが好ましい。機械学習には、深層学習に加え、決定木、サポートベクトルマシン、ランダムフォレスト、回帰分析、教師あり学習、半教師なし学習、教師なし学習、強化学習、深層強化学習、ニューラルネットワークを用いた学習、敵対的生成ネットワーク等が含まれる。 The fifth determination unit 45 is preferably equipped with a classifier 45a that, when an examination image is input, calculates the probability that swallowing is in progress and determines whether or not swallowing is in progress. The classifier 45a is a classifier generated using machine learning. It is preferable to use deep learning for the machine learning, and for example, it is preferable to use a multi-layer convolutional neural network. In addition to deep learning, machine learning includes decision trees, support vector machines, random forests, regression analysis, supervised learning, semi-unsupervised learning, unsupervised learning, reinforcement learning, deep reinforcement learning, learning using a neural network, generative adversarial networks, and the like.

分類器45aは、嚥下中及び非嚥下中と判定された画像を予め学習した機械学習であることが好ましい。なお、分類器45aは自動的に嚥下中及び非嚥下中の画像をクラスタリングする教師なし学習又は半教師なし学習を用いた機械学習であってもよい。また、嚥下中及び非嚥下中の画像に加え、嚥下関係音及び非嚥下関係音を分類器45aに予め学習させておき、検査時に検査画像に加えて音声信号を入力し、嚥下中である確率又は非嚥下中である確率を出力させるようにしてもよい。 It is preferable that the classifier 45a is a machine learning type that has previously learned images determined to be swallowing and non-swallowing. The classifier 45a may be a machine learning type that uses unsupervised learning or semi-unsupervised learning to automatically cluster images of swallowing and non-swallowing. Furthermore, in addition to images of swallowing and non-swallowing, the classifier 45a may be previously trained on swallowing-related sounds and non-swallowing-related sounds, and an audio signal may be input in addition to the test image during the test, and the probability of swallowing or non-swallowing may be output.

分類器45aに入力される検査画像(図12上段、検査画像45b、及び、図12下段、検査画像45d)は、少なくとも1フレーム毎の検査画像の画像中心から、少なくとも縦方向及び横方向へ向かって224ピクセルの領域(画像処理対象領域45g)を画像処理対象とする。分類器45aは、図12に例示するように、嚥下中である確率を出力する。この確率が第4閾値以上の場合、確率を算出したフレームの検査画像を嚥下中と判定する。なお、第4閾値の値は0.001から0.999の範囲で、任意に設定できる。 The test images input to the classifier 45a (test image 45b in the upper part of FIG. 12 and test image 45d in the lower part of FIG. 12) are processed by processing an area of at least 224 pixels vertically and horizontally from the center of the test image for at least one frame (image processing target area 45g). As shown in the example of FIG. 12, the classifier 45a outputs the probability of swallowing. If this probability is equal to or greater than a fourth threshold, it determines that the test image of the frame for which the probability was calculated is swallowing. The value of the fourth threshold can be set arbitrarily in the range of 0.001 to 0.999.

具体例を詳説する。図12の上段は、嚥下運動が起きていない検査画像45bを用いる例である。検査画像45bを分類器45aに入力すると、これに対応する嚥下の確率45cが出力される。図12の例において、第4閾値を0.98とすると、確率45cは第4閾値未満となり、検査画像45bが非嚥下中と判定される。 A specific example will be explained in detail. The top part of Fig. 12 is an example using test image 45b in which no swallowing movement is occurring. When test image 45b is input to classifier 45a, the corresponding swallowing probability 45c is output. In the example of Fig. 12, if the fourth threshold is set to 0.98, probability 45c is less than the fourth threshold, and test image 45b is determined to be not swallowing.

図12の下段は、嚥下運動が起きている検査画像45dを用いる例である。検査画像45dを分類器45aに入力すると、これに対応する嚥下の確率45eが出力される。図12の例において、第4閾値を0.98とすると、確率45cは第4閾値以上となり、検査画像45bが嚥下中と判定される。 The bottom part of Figure 12 shows an example using test image 45d, in which a swallowing movement is occurring. When test image 45d is input to classifier 45a, the corresponding swallowing probability 45e is output. In the example of Figure 12, if the fourth threshold is set to 0.98, probability 45c is equal to or greater than the fourth threshold, and test image 45b is determined to be in the process of swallowing.

また、分類器45aに入力される検査画像は撮像センサから入力される画像信号の他に、第1、第2、第3の嚥下検出アルゴリズムによって嚥下中か否かを判定された検査画像を用いてもよい。また、分類器45aで嚥下中か否かを判定された検査画像に対して、第1、第2、第3、第4の嚥下検出アルゴリズムを用いて、分類器45aが出力した嚥下中又は非嚥下中の判定を修正してもよい。 The test image input to the classifier 45a may be an image signal input from the imaging sensor, or may be a test image determined as being swallowed or not by the first, second, or third swallowing detection algorithm. The test image determined as being swallowed or not by the classifier 45a may be corrected by using the first, second, third, or fourth swallowing detection algorithm to determine whether or not swallowing is occurring, as output by the classifier 45a.

なお、嚥下の判定のタイミングとしては、検査中にリアルタイムで実施し、検査画面に結果を表示することを想定しているが、検査終了後に実施してもよい。検査終了後に自動的に実施して結果を記録してもよい。医師等のユーザーが、必要な動画だけ判定させるように指示を受けたときだけ判定してもよい。PACS(Picture Archiving and Communication Systems)、電子カルテ、サーバ等である記録装置17から画像を呼び出して表示させる際に、嚥下判定を実施してもよい。コンピュータ16はプロセッサ装置15とは独立させて、USB(Universal Serial Bus)メモリなどの外部記録装置に記録した動画をコンピュータ16で読み込み、判定させてもよい。上記構成により、検査画像から自動的に嚥下判定を行うことでユーザーの診断を補助することができる。 The timing of swallowing assessment is assumed to be performed in real time during the examination and the results are displayed on the examination screen, but it may be performed after the examination is completed. It may be performed automatically after the examination is completed and the results are recorded. It may be performed only when a user such as a doctor is instructed to assess only the necessary videos. Swallowing assessment may be performed when images are called up and displayed from a recording device 17 such as a PACS (Picture Archiving and Communication Systems), electronic medical record, or server. The computer 16 may be independent of the processor device 15, and may read and assess videos recorded on an external recording device such as a USB (Universal Serial Bus) memory. With the above configuration, swallowing assessment can be performed automatically from the examination images to assist the user in diagnosis.

嚥下回数カウント部47は、第1判定部41、第2判定部42、第3判定部43、第4判定部44、又は第5判定部45のいずれか1以上において「嚥下中」又は「非嚥下中」と判定された時系列的に連続する一連の検査画像(動画)において、嚥下動作が何回行われたかを判定する。嚥下回数のカウントは、医師等のユーザーが検査画像を見返す際の負担を軽減するための機能である。本実施形態の画像解析の方法を用いることにより、嚥下内視鏡検査中又は検査後に膨大な数の画像に対して嚥下判定がなされる。しかし、医師が診断を行う際は、嚥下中の画像そのものではなく一連の動画として取得される1回の嚥下動作を観察し、その上で嚥下動作が正常であるか異常であるかを診断する。このため、取得された動画において、1回の嚥下動作がどのタイミングで生じたかを把握する必要がある。以下、具体的なカウントの方法を説明する。 The swallow count unit 47 determines how many times a swallowing action has occurred in a series of chronologically consecutive examination images (videos) that have been determined to be "swallowing" or "not swallowing" by one or more of the first determination unit 41, the second determination unit 42, the third determination unit 43, the fourth determination unit 44, or the fifth determination unit 45. Counting the number of swallows is a function for reducing the burden on users such as doctors when reviewing the examination images. By using the image analysis method of this embodiment, swallowing judgment is made on a huge number of images during or after a swallowing endoscopy examination. However, when a doctor makes a diagnosis, he or she observes one swallowing action acquired as a series of videos rather than the image during swallowing itself, and then diagnoses whether the swallowing action is normal or abnormal. For this reason, it is necessary to know at what timing one swallowing action occurred in the acquired video. A specific counting method will be described below.

嚥下回数カウント部47には、第1判定部41、第2判定部42、第3判定部43、又は第5判定部45のいずれか1以上において「嚥下中」又は「非嚥下中」の状態が対応付けられた一連の検査画像が送信される。図13は、嚥下回数カウント部47に送信される、「嚥下中」又は「非嚥下中」と判定された一連の検査画像47aについて示している。一連の検査画像47aは時系列的に取得される画像であり、それぞれ「嚥下中」(図13では「A」で示す)又は「非嚥下中」(図13では「B」で示す)と判定されている。以下、一連の「嚥下中」の検査画像を嚥下中動画、一連の「非嚥下中」の検査画像を非嚥下中動画と呼ぶ。 A series of test images associated with a state of "swallowing" or "not swallowing" in any one or more of the first judgment unit 41, the second judgment unit 42, the third judgment unit 43, or the fifth judgment unit 45 are transmitted to the swallowing count unit 47. FIG. 13 shows a series of test images 47a that are determined to be "swallowing" or "not swallowing" and are transmitted to the swallowing count unit 47. The series of test images 47a are images acquired in chronological order, and are determined to be "swallowing" (indicated by "A" in FIG. 13) or "not swallowing" (indicated by "B" in FIG. 13), respectively. Hereinafter, a series of test images "swallowing" will be referred to as a "swallowing video," and a series of test images "not swallowing" will be referred to as a "not swallowing video."

嚥下回数カウント部47は、嚥下中動画の後に非嚥下中動画が出現したタイミングから、非嚥下中動画の時間が一定期間を超えた場合、嚥下回数をカウントする。すなわち、嚥下中動画が取得された時間である嚥下連続期間の後、非嚥下中動画が取得された時間である非嚥下連続期間が一定期間を超えた場合に、一定期間を超えた非嚥下連続期間の直前の嚥下中動画について、1回の嚥下動作と判定する。 The swallowing count unit 47 counts the number of swallows when the duration of the non-swallowing video exceeds a certain period from the time when the non-swallowing video appears after the swallowing video. In other words, when the continuous non-swallowing period, which is the time when the non-swallowing video was acquired, exceeds a certain period after the continuous swallowing period, which is the time when the swallowing video was acquired, the swallowing video immediately before the continuous non-swallowing period that exceeded the certain period is determined to be one swallowing action.

又は、嚥下連続期間の後、非嚥下連続期間が一定期間を超えた場合に、一定期間を超えた非嚥下連続期間より前の嚥下連続期間嚥下中動画と、一定期間を超えない非嚥下中動画と、を合わせた動画について、1回の嚥下動作と判定する。なお、「一定期間を超えた非嚥下連続期間より前の嚥下連続期間嚥下中動画と、一定期間を超えない非嚥下中動画」には、一度、1回の嚥下動作と判定された動画は含まないことで、嚥下回数のカウントの重複を防ぐ。 Or, if a continuous non-swallowing period exceeds a certain period after a continuous swallowing period, a combined video of swallowing during a continuous swallowing period before the continuous non-swallowing period that exceeded the certain period and a non-swallowing video not exceeding the certain period are determined to be a single swallowing action. Note that by not including videos that were once determined to be a single swallowing action in "videos of swallowing during a continuous swallowing period before the continuous non-swallowing period that exceeded the certain period and a non-swallowing video not exceeding the certain period," duplicate swallow counts are prevented.

嚥下回数カウント部47における嚥下回数カウント方法の具体例を図14に示す。嚥下中動画を動画A、非嚥下中動画を動画Bとする。また、「嚥下」とは嚥下連続期間のことを指し、「非嚥下」とは非嚥下連続期間のことを指す。図14に示す検査開始から検査終了までの、Tで示す時間経過のポイントについて時系列順に以下説明する。T0(検査開始)からT1は動画B(非嚥下中動画)が撮像された非嚥下連続期間、T1からT2は動画A(嚥下中動画)が撮像された嚥下連続期間、T2からT3は動画Bが撮像された非嚥下連続期間である。ここで、T2からT3へと時間が経過する間に、T2からは一定期間Tsを超えている。したがって、T2+Tsの時点において、T1からT2の時間に含まれる検査画像を1回の嚥下動作と判定する。 A specific example of the swallow count method in the swallow count count unit 47 is shown in FIG. 14. The video during swallowing is designated as video A, and the video during non-swallowing is designated as video B. In addition, "swallowing" refers to a continuous period of swallowing, and "non-swallowing" refers to a continuous period of non-swallowing. The points of time lapse indicated by T from the start of the examination to the end of the examination shown in FIG. 14 will be described below in chronological order. T0 (start of examination) to T1 is the continuous period of non-swallowing during which video B (video during non-swallowing) was captured, T1 to T2 is the continuous period of swallowing during which video A (video during swallowing) was captured, and T2 to T3 is the continuous period of non-swallowing during which video B was captured. Here, as time passes from T2 to T3, a certain period of time Ts has passed since T2. Therefore, at the time point of T2+Ts, the examination image included in the time from T1 to T2 is determined to be one swallowing action.

また、T3からT4は動画Aが撮像された嚥下連続期間、T4からT5は動画Bが撮像された非嚥下連続期間、T5からT6は動画Aが撮像された嚥下連続期間、T6からT7は動画Bが撮像された非嚥下連続期間である。ここで、T4からT5へと時間が経過する間には、T4から一定期間Tsを超えていない。一方、T6からT7へと時間が経過する間には、T6から一定期間Tsを超えている。この場合は、T6+Tsの時点において、T3からT6の動画に含まれる検査画像を1回の嚥下動作と判定する。 Furthermore, the period from T3 to T4 is the continuous swallowing period during which video A was captured, the period from T4 to T5 is the continuous non-swallowing period during which video B was captured, the period from T5 to T6 is the continuous swallowing period during which video A was captured, and the period from T6 to T7 is the continuous non-swallowing period during which video B was captured. Here, while time passes from T4 to T5, the certain period Ts from T4 is not exceeded. Meanwhile, while time passes from T6 to T7, the certain period Ts from T6 is exceeded. In this case, at the time point of T6+Ts, the test image included in the video from T3 to T6 is determined to be one swallowing action.

図14に示す具体例において、嚥下動作は2回となる。この例においては、それぞれの嚥下動作のタイミング、例えば、開始時刻T1、T3、および終了時刻T2、T6が結果記録部34に記録される。なお、一定期間Tsの長さは、ユーザーが設定してもよく、自動的に設定されてもよい。上記構成により、検査画像から1回の嚥下動作を判定することができる。また、一連の検査画像から極めて短時間の間に「非嚥下中」が「嚥下中」の画像に存在する場合に、余計に嚥下動作の回数をカウントすることを防ぎ、検査後において効率的にチェックし易い動画の表示用画面を生成することができる。 In the specific example shown in FIG. 14, there are two swallowing actions. In this example, the timing of each swallowing action, for example, start times T1 and T3 and end times T2 and T6, are recorded in the result recording unit 34. The length of the fixed period Ts may be set by the user or automatically. With the above configuration, one swallowing action can be determined from the test images. Furthermore, when a "not swallowing" image is present in a "swallowing" image within an extremely short period of time from a series of test images, counting the number of swallowing actions excessively can be prevented, and a video display screen that can be generated that is easy to check efficiently after the test.

嚥下回数カウント部47で嚥下動作の回数をカウントされた検査画像は、表示制御部32に送信される。表示制御部32は、図15に示すような表示用画面50を生成する。表示用画面50は、ディスプレイ18に表示される。 The test image in which the number of swallowing actions has been counted by the swallow count unit 47 is transmitted to the display control unit 32. The display control unit 32 generates a display screen 50 as shown in FIG. 15. The display screen 50 is displayed on the display 18.

表示用画面50では、図15に示すように、現在の検査画像50aが表示され、シークバー51で全体の再生時間を、シークボタン52の位置で、現在の再生時間を示す。現在の再生時間は、シークボタン52のシークバー51上における操作、再生動画巻き戻しボタン53及び再生動画早送りボタン54で調節できる。なお、一時停止ボタン55で、再生中の動画を一時停止でき、再生ボタン56で再生できる。また、検査画像の1回の嚥下動作と判定された箇所57を、嚥下動作の開始時刻および終了時刻から計算し、認識可能な形式で表すことが好ましい。例えば、図15に示すように、1回の嚥下動作と判定された箇所57をシークバー51に表示する。上記構成により、ユーザーは嚥下中の検査画像まで動画をスキップすることができ、動画全体から嚥下中の箇所を探す手間を省くことができる。 As shown in FIG. 15, the display screen 50 displays the current test image 50a, and the seek bar 51 indicates the total playback time, while the position of the seek button 52 indicates the current playback time. The current playback time can be adjusted by operating the seek button 52 on the seek bar 51, the rewind playback button 53, and the fast forward playback button 54. The video being played can be paused by the pause button 55, and can be played by the play button 56. It is also preferable that the portion 57 of the test image determined to be one swallowing movement is calculated from the start and end times of the swallowing movement and displayed in a recognizable format. For example, as shown in FIG. 15, the portion 57 determined to be one swallowing movement is displayed on the seek bar 51. With the above configuration, the user can skip the video to the test image during swallowing, eliminating the need to search for the portion during swallowing in the entire video.

検査画像を取得してから表示用画面を表示するまでの一連の流れを、図16に示すフローチャートに沿って説明する。画像取得部31が検査画像を取得し、嚥下判定部40に送信する(ステップS301)。次いで、第1判定部41、第2判定部42、第3判定部43、第4判定部44、又は、第5判定部45のいずれか1以上において、嚥下中であるか否かの判定が行われる(ステップS302)。「嚥下中」又は「非嚥下中」の判定がなされた一連の検査画像は、嚥下回数カウント部47において、1回の嚥下動作の判定がなされる(ステップS303)。1回の嚥下動作の判定がなされた検査画像は、表示制御部32において表示用画面として生成され、ディスプレイ18に表示される(ステップS304)。 A series of steps from acquiring the test images to displaying the display screen will be described with reference to the flowchart shown in FIG. 16. The image acquisition unit 31 acquires the test images and transmits them to the swallowing determination unit 40 (step S301). Next, at least one of the first determination unit 41, the second determination unit 42, the third determination unit 43, the fourth determination unit 44, and the fifth determination unit 45 determines whether or not swallowing is occurring (step S302). The series of test images that have been determined to be "swallowing" or "not swallowing" are judged to have one swallowing movement by the swallowing count unit 47 (step S303). The test images that have been determined to have one swallowing movement are generated as a display screen by the display control unit 32 and displayed on the display 18 (step S304).

本実施形態では、プロセッサ装置15及びコンピュータ16が内視鏡システム10に設けられている例で説明をしたが、本発明はこれに限定されず、他の医療用装置を用いてもよい。また、この内視鏡12は、硬性鏡又は軟性鏡が用いられてよい。また、内視鏡システム10のうち画像取得部31及び/又は制御部30の一部又は全部は、例えばプロセッサ装置15と通信して内視鏡システム10と連携する医療画像処理装置に設けることができる。例えば、内視鏡システム10から直接的に、又は、PACSから間接的に、内視鏡12で撮像した画像を取得する診断支援装置に設けることができる。また、内視鏡システム10を含む、第1検査装置、第2検査装置、…、第N検査装置等の各種検査装置と、ネットワークを介して接続する医療業務支援装置に、内視鏡システム10のうち画像取得部31及び/又は制御部30の一部又は全部を設けることができる。 In this embodiment, the processor device 15 and the computer 16 are provided in the endoscope system 10, but the present invention is not limited to this, and other medical devices may be used. In addition, the endoscope 12 may be a rigid or flexible endoscope. In addition, part or all of the image acquisition unit 31 and/or the control unit 30 of the endoscope system 10 may be provided in a medical image processing device that communicates with the processor device 15 and cooperates with the endoscope system 10. For example, they may be provided in a diagnosis support device that acquires images captured by the endoscope 12 directly from the endoscope system 10 or indirectly from a PACS. In addition, part or all of the image acquisition unit 31 and/or the control unit 30 of the endoscope system 10 may be provided in a medical work support device that is connected via a network to various examination devices, such as a first examination device, a second examination device, ..., an Nth examination device, including the endoscope system 10.

本実施形態において、制御部30、画像取得部31、表示制御部32、画像入力部33、結果記録部34、嚥下判定部40といった各種の処理を実行する処理部(processing unit)のハードウェア的な構造は、次に示すような各種のプロセッサ(processor)である。各種のプロセッサには、ソフトウエア(プログラム)を実行して各種の処理部として機能する汎用的なプロセッサであるCPU(Central Processing Unit)、FPGA(Field Programmable Gate Array) 等の製造後に回路構成を変更可能なプロセッサであるプログラマブルロジックデバイス(Programmable Logic Device:PLD)、各種の処理を実行するために専用に設計された回路構成を有するプロセッサである専用電気回路等が含まれる。 In this embodiment, the hardware structure of the processing units that execute various processes, such as the control unit 30, image acquisition unit 31, display control unit 32, image input unit 33, result recording unit 34, and swallowing determination unit 40, is various processors as shown below. The various processors include a CPU (Central Processing Unit), which is a general-purpose processor that executes software (programs) and functions as various processing units, a programmable logic device (PLD), which is a processor whose circuit configuration can be changed after manufacture, such as an FPGA (Field Programmable Gate Array), and a dedicated electric circuit, which is a processor with a circuit configuration designed specifically to execute various processes.

1つの処理部は、これら各種のプロセッサのうちの1つで構成されてもよく、同種又は異種の2つ以上のプロセッサの組み合せ(例えば、複数のFPGAや、CPUとFPGAの組み合わせ)で構成されてもよい。また、複数の処理部を1つのプロセッサで構成してもよい。複数の処理部を1つのプロセッサで構成する例としては、第1に、クライアントやサーバ等のコンピュータに代表されるように、1つ以上のCPUとソフトウエアの組み合わせで1つのプロセッサを構成し、このプロセッサが複数の処理部として機能する形態がある。第2に、システムオンチップ(System On Chip:SoC)等に代表されるように、複数の処理部を含むシステム全体の機能を1つのIC(Integrated Circuit)チップで実現するプロセッサを使用する形態がある。このように、各種の処理部は、ハードウェア的な構造として、上記各種のプロセッサを1つ以上用いて構成される。 A processing unit may be configured with one of these various processors, or may be configured with a combination of two or more processors of the same or different types (for example, multiple FPGAs, or a combination of a CPU and an FPGA). Multiple processing units may also be configured with one processor. As an example of configuring multiple processing units with one processor, first, as represented by a computer such as a client or server, one processor is configured with a combination of one or more CPUs and software, and this processor functions as multiple processing units. Second, as represented by a system on chip (SoC), there is a form in which a processor is used that realizes the functions of the entire system including multiple processing units with a single IC (Integrated Circuit) chip. In this way, the various processing units are configured using one or more of the above various processors as a hardware structure.

さらに、これらの各種のプロセッサのハードウェア的な構造は、より具体的には、半導体素子等の回路素子を組み合わせた形態の電気回路(circuitry)である。また、記憶部のハードウェア的な構造はHDD(hard disc drive)やSSD(solid state drive)等の記憶装置である。 More specifically, the hardware structure of these various processors is an electric circuit (circuitry) that combines circuit elements such as semiconductor elements. The hardware structure of the memory unit is a storage device such as a hard disk drive (HDD) or a solid state drive (SSD).

10 内視鏡システム
12 内視鏡
12a 挿入部
12b 操作部
12c 湾曲部
12d 先端部
12e アングルノブ
12h 静止画像取得指示スイッチ
12i ズーム操作部
14 光源装置
15 プロセッサ装置
16 コンピュータ
17 記録装置
18 ディスプレイ
19 ユーザーインターフェース
20 光源部
22 光源制御部
30 制御部
31 画像取得部
32 表示制御部
33 画像入力部
34 結果記録部
40 嚥下判定部
41 第1判定部
41a、41b、41d、41e、42a、42c、43a、43b、45b、45d、100 検査画像
41c、41f 変化量の例
41g、42g、43g、45g 画像処理対象領域
42 第2判定部
42b、42d 図8上段の画像特徴量の例
43 第3判定部
43c 画像特徴点
44 第4判定部
45 第5判定部
45a 分類器
45c、45e 確率
47 嚥下回数カウント部
47a 一連の検査画像
50 表示用画面
50a 現在の検査画像
51 シークバー
52 シークボタン
53 再生動画巻き戻しボタン
54 再生動画早送りボタン
55 一時停止ボタン
56 再生ボタン
57 1回の嚥下動作と判定された箇所
Es 食道
Eg 喉頭蓋
Ev 喉頭蓋谷
F 食物
Rg 声門裂
Ps 梨状陥凹
Sp 軟口蓋
To 舌
Tr 気管
LIST OF SYMBOLS 10 ENDOSCOPIC SYSTEM 12 ENDOSCOPIC 12a INSERTION SECTION 12b OPERATION SECTION 12c BENDING SECTION 12d TIP SECTION 12e ANGLE KNOB 12h STILL IMAGE ACQUISITION INSTRUCTION SWITCH 12i ZOOM OPERATION SECTION 14 LIGHT SOURCE DEVICE 15 PROCESSOR 16 COMPUTER 17 RECORDING DEVICE 18 DISPLAY 19 USER INTERFACE 20 LIGHT SOURCE SECTION 22 LIGHT SOURCE CONTROL 30 CONTROL SECTION 31 IMAGE ACQUISITION SECTION 32 DISPLAY CONTROL SECTION 33 IMAGE INPUT SECTION 34 RESULT RECORDING SECTION 40 SWALLOWING DECISION SECTION 41 FIRST DETERMINATION SECTION 41a, 41b, 41d, 41e, 42a, 42c, 43a, 43b, 45b, 45d, 100 TEST IMAGE 41c, 41f EXAMPLE OF VARIATION 41g, 42g, 43g, 45g IMAGE PROCESSING SUBJECT REGION 42 SECOND DETERMINATION SECTION 42b, 42d Examples of image features in the upper part of Fig. 8 43 Third determination unit 43c Image feature points 44 Fourth determination unit 45 Fifth determination unit 45a Classifier 45c, 45e Probability 47 Swallowing count unit 47a Series of test images 50 Display screen 50a Current test image 51 Seek bar 52 Seek button 53 Rewind video playback button 54 Fast forward video playback button 55 Pause button 56 Play button 57 Locations determined as one swallowing action Es Esophagus Eg Epiglottis Ev Vallecula F Food Rg Glottic cleft Ps Piriform sinus Sp Soft palate To Tongue Tr Trachea

Claims (12)

被写体を照明し、前記被写体からの反射光を撮像する内視鏡システムにおいて、
制御用プロセッサを備え、
前記制御用プロセッサは、
検査画像を取得し、
時系列的に前後する前記検査画像間の変化量が第1閾値以上の場合、前記検査画像に係る画像特徴量が第2閾値以上の場合、又は、嚥下関係音を取得した場合のいずれかに該当する場合に嚥下中であると判定し、
前記制御用プロセッサは、
前記検査画像を分類器に入力し、嚥下中である確率を算出し、前記確率が第4閾値以上の場合に嚥下中と判定し、
前記検査画像に係る画像特徴は、前記検査画像から算出されるエッジ量である内視鏡システム。
1. An endoscope system that illuminates an object and captures an image of reflected light from the object,
A control processor is provided,
The control processor includes:
Obtaining an inspection image;
determining that swallowing is occurring when an amount of change between the test images successive in time series is equal to or greater than a first threshold, when an image feature amount relating to the test image is equal to or greater than a second threshold, or when swallowing-related sounds are acquired;
The control processor includes:
The test image is input to a classifier to calculate a probability that swallowing is occurring, and when the probability is equal to or greater than a fourth threshold, it is determined that swallowing is occurring;
An endoscope system, wherein the image feature related to the inspection image is an edge amount calculated from the inspection image.
前記変化量は、時系列的に前後する前記検査画像から単純画素値差分の絶対値を用いて求められる値である請求項1に記載の内視鏡システム。 The endoscope system according to claim 1, wherein the amount of change is a value calculated using the absolute value of the simple pixel value difference between the inspection images that come before and after in a time series. 前記嚥下関係音は、前記制御用プロセッサが取得した音声信号を解析し、患者から発せられた音声であると判定された音声信号である請求項1又は2に記載の内視鏡システム。 The endoscope system according to claim 1 or 2, wherein the swallowing-related sound is an audio signal that is determined to be a sound emitted by a patient by analyzing an audio signal acquired by the control processor. 前記制御用プロセッサは、前記音声信号を、前記嚥下関係音、又は咳、ムセ、呼吸音もしくは発声のいずれかである非嚥下関係音と判定する請求項3に記載の内視鏡システム。 The endoscope system according to claim 3, wherein the control processor determines the audio signal to be a swallowing-related sound or a non-swallowing-related sound, which is a cough, a chomp, a breathing sound, or a vocalization. 前記制御用プロセッサは、前記検査画像から嚥下中と判定した場合であって、かつ、前記非嚥下関係音が取得された場合、前記検査画像を非嚥下中と判定する請求項4に記載の内視鏡システム。 The endoscope system according to claim 4, wherein the control processor determines that the test image indicates non-swallowing when the test image indicates swallowing and the non-swallowing-related sound is acquired. 前記制御用プロセッサは、
前記検査画像と前記音声信号とを分類器に入力し、嚥下中である確率を算出し、前記確率が第4閾値以上の場合に嚥下中と判定する請求項3ないし5のいずれか1項に記載の内視鏡システム。
The control processor includes:
The endoscope system according to any one of claims 3 to 5, wherein the inspection image and the audio signal are input to a classifier, a probability that swallowing is in progress is calculated, and swallowing is determined to be in progress if the probability is equal to or greater than a fourth threshold value.
前記分類器は、嚥下中又は非嚥下中と判定された画像で学習されている請求項記載の内視鏡システム。 The endoscope system according to claim 6 , wherein the classifier is trained using images determined to indicate swallowing or non-swallowing. 前記制御用プロセッサは、
嚥下中と判定された一連の前記検査画像を嚥下中動画、非嚥下中と判定された一連の前記検査画像を非嚥下中動画とした場合であって、
前記嚥下中動画が取得された時間である嚥下連続期間の後、前記非嚥下中動画が取得された時間である非嚥下連続期間が一定期間を超えた場合に、前記一定期間を超えた前記非嚥下連続期間の直前の前記嚥下連続期間に取得された前記嚥下中動画を1回の嚥下動作と判定して嚥下回数をカウントする請求項1ないしのいずれか1項に記載の内視鏡システム。
The control processor includes:
A series of the test images determined to be during swallowing is a swallowing video, and a series of the test images determined to be during non-swallowing is a non-swallowing video,
An endoscopic system as described in any one of claims 1 to 7, wherein, when a continuous non-swallowing period, which is the time when the swallowing video was acquired, exceeds a certain period after a continuous swallowing period, which is the time when the non-swallowing video was acquired, the swallowing video acquired during the continuous swallowing period immediately before the continuous non-swallowing period that exceeds the certain period is determined to be one swallowing action, and the number of swallows is counted.
前記制御用プロセッサは、
前記一定期間を超えた前記非嚥下連続期間より前の前記嚥下連続期間に取得された前記嚥下中動画と、前記一定期間を超えない前記非嚥下連続期間に取得された前記非嚥下中動画と、を合わせた動画を1回の嚥下動作と判定し、嚥下回数をカウントする請求項に記載の内視鏡システム。
The control processor includes:
The endoscopic system of claim 8, wherein a combined video of the swallowing motion acquired during the continuous non-swallowing period prior to the continuous non-swallowing period that exceeds the certain period and a video of the non-swallowing motion acquired during the continuous non-swallowing period not exceeding the certain period are determined to be one swallowing action, and the number of swallows is counted.
前記一定期間は任意に設定可能である請求項又はに記載の内視鏡システム。 The endoscope system according to claim 8 or 9 , wherein the certain period can be arbitrarily set. 前記制御用プロセッサは、
時系列順に配列した前記検査画像のうち、前記1回の嚥下動作であると判定された箇所を認識可能である表示用画面を表示する請求項又はに記載の内視鏡システム。
The control processor includes:
The endoscope system according to claim 8 or 9 , further comprising a display screen that enables recognition of a portion determined to be one swallowing movement among the examination images arranged in chronological order.
制御用プロセッサを備え、被写体を照明し、前記被写体からの反射光を撮像する内視鏡システムの作動方法において、
前記制御用プロセッサは、
検査画像を取得するステップと、
時系列的に前後する前記検査画像間の変化量が第1閾値以上の場合、前記検査画像に係る画像特徴量が第2閾値以上の場合、又は、嚥下関係音を取得した場合のいずれかに該当する場合に嚥下中であると判定するステップと、を有し、
前記制御用プロセッサは、
前記検査画像を分類器に入力し、嚥下中である確率を算出し、前記確率が第4閾値以上の場合に嚥下中と判定し、
前記検査画像に係る画像特徴は、前記検査画像から算出されるエッジ量である内視鏡システムの作動方法。
1. A method for operating an endoscope system including a control processor, illuminating an object, and capturing an image of reflected light from the object, comprising:
The control processor includes:
acquiring an inspection image;
determining that swallowing is occurring when an amount of change between the test images successive in time series is equal to or greater than a first threshold, when an image feature amount relating to the test image is equal to or greater than a second threshold, or when swallowing-related sounds are acquired;
The control processor includes:
The test image is input to a classifier to calculate a probability that swallowing is occurring, and when the probability is equal to or greater than a fourth threshold, it is determined that swallowing is occurring;
A method for operating an endoscope system, wherein the image feature related to the inspection image is an edge amount calculated from the inspection image.
JP2021086545A 2021-05-21 2021-05-21 Endoscope system and method of operation thereof Active JP7653838B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2021086545A JP7653838B2 (en) 2021-05-21 2021-05-21 Endoscope system and method of operation thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2021086545A JP7653838B2 (en) 2021-05-21 2021-05-21 Endoscope system and method of operation thereof

Publications (2)

Publication Number Publication Date
JP2022179218A JP2022179218A (en) 2022-12-02
JP7653838B2 true JP7653838B2 (en) 2025-03-31

Family

ID=84238945

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021086545A Active JP7653838B2 (en) 2021-05-21 2021-05-21 Endoscope system and method of operation thereof

Country Status (1)

Country Link
JP (1) JP7653838B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2025109270A (en) 2024-01-12 2025-07-25 富士フイルム株式会社 Image processing device and method of operation thereof
JP2025109271A (en) 2024-01-12 2025-07-25 富士フイルム株式会社 IMAGE PROCESSING DEVICE, OPERATION METHOD OF IMAGE PROCESSING DEVICE, IMAGE PROCESSING PROGRAM, AND DIAGNOSIS SUPPORT DEVICE

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009279122A (en) 2008-05-21 2009-12-03 Konica Minolta Medical & Graphic Inc Status detector
JP2013017694A (en) 2011-07-12 2013-01-31 Univ Of Tsukuba Instrument, system, and method for measuring swallowing function data
JP2016185209A (en) 2015-03-27 2016-10-27 Necソリューションイノベータ株式会社 Deglutition detection device, deglutition detection method, and program
JP3209885U (en) 2017-01-30 2017-04-13 リブト株式会社 Medical monitoring system
US20170337684A1 (en) 2016-05-18 2017-11-23 Stuart Bradley Systems and methods for observing and analyzing swallowing
JP2019042148A (en) 2017-09-01 2019-03-22 国立大学法人静岡大学 Deglutition sound determination device and deglutition sound determination method
WO2019216084A1 (en) 2018-05-09 2019-11-14 富士フイルム株式会社 Examination moving image processing device, examination moving image processing method, and examination moving image processing program
WO2022013940A1 (en) 2020-07-14 2022-01-20 オリンパス株式会社 System for examination of swallowing, swallowing examination method, and recording medium in which swallowing examination program is recorded

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009279122A (en) 2008-05-21 2009-12-03 Konica Minolta Medical & Graphic Inc Status detector
JP2013017694A (en) 2011-07-12 2013-01-31 Univ Of Tsukuba Instrument, system, and method for measuring swallowing function data
JP2016185209A (en) 2015-03-27 2016-10-27 Necソリューションイノベータ株式会社 Deglutition detection device, deglutition detection method, and program
US20170337684A1 (en) 2016-05-18 2017-11-23 Stuart Bradley Systems and methods for observing and analyzing swallowing
JP3209885U (en) 2017-01-30 2017-04-13 リブト株式会社 Medical monitoring system
JP2019042148A (en) 2017-09-01 2019-03-22 国立大学法人静岡大学 Deglutition sound determination device and deglutition sound determination method
WO2019216084A1 (en) 2018-05-09 2019-11-14 富士フイルム株式会社 Examination moving image processing device, examination moving image processing method, and examination moving image processing program
WO2022013940A1 (en) 2020-07-14 2022-01-20 オリンパス株式会社 System for examination of swallowing, swallowing examination method, and recording medium in which swallowing examination program is recorded

Also Published As

Publication number Publication date
JP2022179218A (en) 2022-12-02

Similar Documents

Publication Publication Date Title
US8423123B2 (en) System and method for in-vivo feature detection
US20250057392A1 (en) Endoscope system and method for operating the same
JP5492729B2 (en) Endoscopic image recording apparatus, operation method of endoscopic image recording apparatus, and program
US12336834B2 (en) Examination device, endoscope system, and examination method
JP6342390B2 (en) System and method for displaying an image stream
EP4093025B1 (en) Medical image processing system
US20200090548A1 (en) Image processing apparatus, image processing method, and computer-readable recording medium
CN104640496A (en) medical device
US7577283B2 (en) System and method for detecting content in-vivo
JP7653838B2 (en) Endoscope system and method of operation thereof
JPWO2019039252A1 (en) Medical image processing apparatus and medical image processing method
EP4091529B1 (en) Medical image processing system and method for operating the same
JP2024164943A (en) Medical image processing device and endoscope system
JP7527634B2 (en) Inspection support device, operation method of inspection support device, and inspection support program
JP7575344B2 (en) Endoscope system and method of operation thereof
US20250232585A1 (en) Image processing device, operation method of image processing device, non-transitory computer readable medium, and diagnosis support apparatus
CN119233784A (en) Image processing device and endoscope system
EP4586192A1 (en) Image processing device and operation method of image processing device
WO2023175916A1 (en) Medical assistance system and image display method
CN116916808A (en) Medical image processing device, medical image processing method and program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20240201

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20240925

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20241001

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20241129

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20241224

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20250121

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20250304

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20250318

R150 Certificate of patent or registration of utility model

Ref document number: 7653838

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150