Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP7620308B2 - Imaging device and measurement coding device - Google Patents
[go: Go Back, main page]

JP7620308B2 - Imaging device and measurement coding device - Google Patents

Imaging device and measurement coding device Download PDF

Info

Publication number
JP7620308B2
JP7620308B2 JP2021008179A JP2021008179A JP7620308B2 JP 7620308 B2 JP7620308 B2 JP 7620308B2 JP 2021008179 A JP2021008179 A JP 2021008179A JP 2021008179 A JP2021008179 A JP 2021008179A JP 7620308 B2 JP7620308 B2 JP 7620308B2
Authority
JP
Japan
Prior art keywords
measurement
unit
matrix
measurement data
cowh
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021008179A
Other languages
Japanese (ja)
Other versions
JP2022112364A (en
Inventor
金佳 周
ジラユー ピエタク
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hosei University
Original Assignee
Hosei University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hosei University filed Critical Hosei University
Priority to JP2021008179A priority Critical patent/JP7620308B2/en
Publication of JP2022112364A publication Critical patent/JP2022112364A/en
Application granted granted Critical
Publication of JP7620308B2 publication Critical patent/JP7620308B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Studio Devices (AREA)

Description

本発明は、イメージング装置及び測定符号化装置に関する。 The present invention relates to an imaging device and a measurement encoding device.

ナイキストシャノンのサンプリング定理は、サンプリングレート(SR)は信号の少なくとも2倍の周波数でなければならないというものであるが、従来のイメージング技術は実装の限界に直面している。近年開発されたCMOSイメージセンサ(CIS)は解像度が4K、8K、16Kであり、高価且つ高消費電力である。さらに、大量の画像データを保存するために巨大な記憶空間を必要とする。 The Nyquist-Shannon sampling theorem states that the sampling rate (SR) must be at least twice the frequency of the signal, but conventional imaging technology faces implementation limitations. Recently developed CMOS image sensors (CIS) have resolutions of 4K, 8K, and 16K, and are expensive and consume high power. Furthermore, they require huge memory space to store large amounts of image data.

画像データの保存及び伝送コストを削減するために、JPEG/JPEG2000、AVC(Advanced Video Coding)、HEVC(High-Efficiency Video Coding)、及びVVC(Versatile Video Coding)等のマルチメディア圧縮ツールが広く用いられている。ソフトウェア及びハードウェアの実装では、世代ごとに最大10倍の複雑さに達する可能性があり、これはCIS設計の障害の結果である。 To reduce the cost of storing and transmitting image data, multimedia compression tools such as JPEG/JPEG2000, AVC (Advanced Video Coding), HEVC (High-Efficiency Video Coding), and VVC (Versatile Video Coding) are widely used. Software and hardware implementations can reach up to 10 times the complexity with each generation, which is the result of CIS design bottlenecks.

すべてのデータ圧縮アルゴリズムは、空間的及び時間的な冗長性を低下させる。原信号は、DCT(Discrete Cosine Transform)、フーリエ変換の変形、DWT(Discrete Wavelet Transform)等の一般的な変換基底を用いた係数の疎なベクトルの観点から、画像データを効率的に圧縮し、これは非可逆である。 All data compression algorithms reduce spatial and temporal redundancy. The original signal is effectively compressed into a sparse vector of coefficients using a common transformation basis such as the Discrete Cosine Transform (DCT), a variant of the Fourier Transform, or the Discrete Wavelet Transform (DWT), which is lossy.

低ビットレートを満たすために非可逆圧縮を実行する場合、そもそもなぜ高次元及び冗長な測定値を収集する必要があるのかという疑問が生じる。ここで、高次元測定を集めて圧縮する代わりに、圧縮された測定値を取得し、測定値と一致する最も疎な高次元信号を導き出すことができる。これは「圧縮センシング」又は「圧縮サンプリング」と呼ばれ、以下において適宜「CS」と表記する。 When performing lossy compression to meet low bitrates, the question arises as to why it is necessary to collect high-dimensional and redundant measurements in the first place. Now, instead of collecting and compressing high-dimensional measurements, we can take the compressed measurements and derive the sparsest high-dimensional signal that matches the measurements. This is called "compressive sensing" or "compressive sampling", and will be abbreviated as "CS" below.

このような圧縮センシングは、データ収集及び処理に革命をもたらす可能性を秘めた新しい視点であり、信号処理、データ圧縮、逆問題の解決、放射システムの設計、レーダー、壁を介したイメージング、SAR(Synthetic Aperture Radar)アンテナのいくつかの強化されたアプローチを可能にしている。 Such compressed sensing is a new perspective that has the potential to revolutionize data collection and processing, enabling several enhanced approaches in signal processing, data compression, solving inverse problems, designing radiating systems, radar, imaging through walls, and synthetic aperture radar (SAR) antennas.

圧縮センシングを用いたブロックベースの計算イメージング(BCI: Block-based Computational Imaging)の進歩が近年注目を集めている。このパラダイムにより、次世代のイメージセンサは、読み出し遅延の短縮及び消費電力の低減に優れた性能を発揮できる。 The advancement of block-based computational imaging (BCI) using compressed sensing has attracted attention in recent years. This paradigm will enable next-generation image sensors to achieve superior performance in terms of shorter readout latency and reduced power consumption.

それにもかかわらず、最小の処理のBCI測定のための新しい符号化アルゴリズムの必要性が高まっている。一般に圧縮センシングは、スパーシティ及びインコヒーレントで構成される2つの主要な基本的条件に基づいて構築される。 Nevertheless, there is an increasing need for new encoding algorithms for BCI measurements with minimal processing. In general, compressed sensing is built on two main fundamental conditions consisting of sparsity and incoherence.

特定のアプリケーションでCSを適用するための重要な条件として、信号特性は、特定の直交変換基底で表現される場合、疎でなければならない。この特性は、少数の係数だけが信号情報の大部分を含み、次のように表現できることを意味する。 An important condition for applying CS in a particular application is that the signal property, when represented in a particular orthogonal transform basis, must be sparse. This property means that only a small number of coefficients contain most of the signal information and can be expressed as follows:

Figure 0007620308000001
ここで、
Figure 0007620308000001
Where:

Figure 0007620308000002
はベクトル化された信号である。
Figure 0007620308000002
is the vectorized signal.

Figure 0007620308000003
は、2次元信号である基底
Figure 0007620308000003
is a two-dimensional signal basis

Figure 0007620308000004
におけるXの射影を含むスパースベクトル、すなわち、画像又はビデオがラスタースキャンによって列ベクトルに変形される。
Figure 0007620308000004
A sparse vector containing the projection of X in x, y, i.e., an image or video is transformed into a column vector by raster scanning.

圧縮センシングの理論は、インコヒーレンスが測定の質及び信号のサンプリング方法に関連する鍵であると主張している。したがって、Xのサンプリングに使用される測定行列 The theory of compressed sensing claims that incoherence is key, related to the quality of the measurement and the way the signal is sampled. Therefore, the measurement matrix used to sample X

Figure 0007620308000005
はコヒーレンスが低くなければならない。
Figure 0007620308000005
must have low coherence.

ベルヌーイ、ガウス、バイナリなどの様々な分布によって Various distributions such as Bernoulli, Gaussian, and binary

Figure 0007620308000006
が得られる。圧縮された測定値
Figure 0007620308000006
The compressed measurement value is obtained.

Figure 0007620308000007
を劣決定系の射影を用いて得ることができる。これは数学的に
Figure 0007620308000007
can be obtained by using the underdetermined projection. This is mathematically

Figure 0007620308000008
と記述できる。ここで、mの次元はn未満でなければならない。
Figure 0007620308000008
where the dimension of m must be less than n.

信号の良好な復元を保証するために、RIP(Restricted Isometry Property)と呼ばれる行列の特性が重要である。次の式を使用して、不均一な分散測定行列のmの下限の次元を決定できる。 To ensure good signal recovery, a property of the matrix called the Restricted Isometry Property (RIP) is important. The following formula can be used to determine the lower bound dimension of m for a non-uniform variance measurement matrix:

Figure 0007620308000009
ここで、
Figure 0007620308000009
Where:

Figure 0007620308000010
である。したがって、不均一な分散測定行列に対するmの下限の次元は、凸最適化を介して非適切(ill-posed)な線形逆問題を解くことによって、次のように記述できる。
Figure 0007620308000010
Therefore, the dimensionality of the lower bound of m for non-uniform variance measurement matrices can be written as follows by solving an ill-posed linear inverse problem via convex optimization:

Figure 0007620308000011
信号を復元するために、圧縮センシングは、信号Xが疎変換
Figure 0007620308000011
To recover the signal, compressed sensing assumes that the signal X is transformed into a sparse

Figure 0007620308000012
により圧縮可能であり、
Figure 0007620308000012
It can be compressed by

Figure 0007620308000013
は、
Figure 0007620308000013
teeth,

Figure 0007620308000014
と非常にインコヒーレントである必要がある。したがって、係数ドメイン(測定ドメイン)の不完全な測定値の次元mから以下のように高精度に復元できる。
Figure 0007620308000014
Therefore, it can be accurately reconstructed from the dimension m of the imperfect measurements in the coefficient domain (measurement domain) as follows:

Figure 0007620308000015
ここで、
Figure 0007620308000015
Where:

Figure 0007620308000016
は逆変換である。
Figure 0007620308000016
is the inverse transformation.

よって、l最小化と呼ばれる凸最適化を用いて、次の式のように、古典的な方法により測定値を復元できる。 Therefore, using a convex optimization called l 1 minimization, we can recover the measurements in a classical way:

Figure 0007620308000017
これは次のように単純化できる。
Figure 0007620308000017
This can be simplified as follows:

Figure 0007620308000018
Figure 0007620308000018

グリーディベースの復元アルゴリズムとして、OMP(Orthogonal Matching Pursuit)、それの拡張であるステップワイズOMP、A*Omp、CoSaMP、及びTwIST2が圧縮センシングのために提案されている。 As greedy-based restoration algorithms, OMP (Orthogonal Matching Pursuit), its extensions Stepwise OMP, A*Omp, CoSaMP, and TwIST2 have been proposed for compressed sensing.

最小化と比較すると、グリーディベースの復元アルゴリズムは一連の部分空間問題を最小限に抑えることで、一般に高速である。しかし、より高い予備知識及び良好な測定量が必要であり、一部のアプリケーションはセンシングデバイスでSRを削減する必要がある場合にそのような情報を得ることが現実的ではない。 Compared to l1 minimization, greedy-based restoration algorithms minimize a series of subspace problems and are generally faster. However, they require higher prior knowledge and good measurements, and it is not practical to obtain such information in some applications where SR needs to be reduced at the sensing device.

スカラー量子化(SQ)は、簡単な測定符号化アプローチを提供した(非特許文献1、2参照)。SQ符号化は、情報理論によるレート歪み(RD)性能の点で非常に非効率的であることを確立した。従来の符号化と比較すると、SQ符号化はビットレートの低い利用を生み出すが、結果的に高い復元エラーが発生する。したがって、QIHT(Quantized Iterative Hard Thresholding)、QCoSaMP(Quantized Compressed Sampling Matching Pursuit)、AOP-QIHT(Adaptive Outlier Pursuit For Quantized Iterative Hard Thresholding)等の、破損した符号化された測定値を予測するために複雑な復元アルゴリズムが必要である。品質劣化は、最終的に復元された画像・ビデオに表示される。 Scalar quantization (SQ) offered a simple measurement coding approach (see non-patent literature 1, 2). It has been established that SQ coding is very inefficient in terms of rate-distortion (RD) performance by information theory. Compared to traditional coding, SQ coding produces low bit-rate utilization but results in high reconstruction errors. Therefore, complex reconstruction algorithms are required to predict the corrupted encoded measurements, such as Quantized Iterative Hard Thresholding (QIHT), Quantized Compressed Sampling Matching Pursuit (QCoSaMP), and Adaptive Outlier Pursuit For Quantized Iterative Hard Thresholding (AOP-QIHT). The quality degradation is finally visible in the reconstructed image/video.

DPCM(Differential Pulse-Code Modulation)は、伝送路上のビットレートを低減するために適用される簡単なアプローチでもある(非特許文献3参照)。DPCM符号化では、以前の符号化されたブロックを1つ使用して現在のブロックを予測する。ただし、以前の符号化されたブロックには、現在のブロックと関係のない無関係な情報が含まれている可能性があり、その結果、ビットレートが不要に増加する。それにもかかわらず、DPCM符号化は実用的な符号化方法を提供する。 Differential Pulse-Code Modulation (DPCM) is also a simple approach that can be applied to reduce the bit rate on the transmission channel (see non-patent document 3). In DPCM coding, one previous coded block is used to predict the current block. However, the previous coded block may contain irrelevant information that is not related to the current block, resulting in an unnecessary increase in the bit rate. Nevertheless, DPCM coding provides a practical coding method.

非特許文献4における符号化手法は、BCI測定に対してDCT符号化を行う。このアプローチは、SQやDPCMよりも符号化効率が向上する。 The coding method in Non-Patent Document 4 performs DCT coding on BCI measurements. This approach improves coding efficiency over SQ and DPCM.

非特許文献5の研究では、量子化器のデッドゾーンで調査された最先端の符号化スキームからの代替アプローチを提案した。非特許文献5では、品質劣化は主に量子化器から来ていると述べ、歪みは測定符号化スキームにおける量子化及びSRの両方に関連していると述べている。したがって、このアプローチでは、測定行列の選択、量子化及びSRのトレードオフ、並びにディープラーニングを用いた復元アルゴリズムを含むシステムパラメータを設計した。さらに、有効な方法は、量子化ステップ及びSRを共同で制御して、任意のビットレートでほぼ最適な品質を達成できる。 In the study of non-patent literature 5, we proposed an alternative approach from the state-of-the-art coding schemes investigated in the quantizer dead zone. In non-patent literature 5, we stated that the quality degradation mainly comes from the quantizer, and the distortion is related to both quantization and SR in the measurement coding scheme. Therefore, in this approach, we designed system parameters including the selection of the measurement matrix, the trade-off between quantization and SR, and a restoration algorithm using deep learning. Furthermore, an effective method can jointly control the quantization step and SR to achieve near-optimal quality at any bit rate.

方向符号化アプローチは非特許文献6で初めて導入されている。SDPC(Spatially Directional Predictive Coding)は、高い復元確率及び低ビットレートでのSQ符号化及びDPCM符号化を達成した効率的な測定符号化アプローチである。この研究では、自然画像をサンプリングするために、測定行列としてランダムガウシアンを用いている。しかし、ガウス測定行列が適用されているため、ビットレートの不安定な利用が生じる。重要なのは、バイナリのみをサポートするBCIに対してこの種の測定行列を用いることができなかったということである。 The directional coding approach was first introduced in Non-Patent Document 6. Spatially Directional Predictive Coding (SDPC) is an efficient measurement coding approach that achieves SQ and DPCM coding with high recovery probability and low bit rate. In this work, a random Gaussian is used as the measurement matrix to sample natural images. However, the Gaussian measurement matrix is applied, which results in unstable utilization of the bit rate. Importantly, this kind of measurement matrix could not be used for BCI, which only supports binary.

H.264/AVCから流用されたイントラ予測のコンセプトを測定符号化と組み合わせ、イントラ予測候補を生成するための測定行列の部分的改変が非特許文献7で提案されている(Modified SRM)。部分的に改変されたランダムバイナリ測定行列を用いた4方向のイントラ予測アプローチであり、この研究は主に符号化された測定値をエンドポイントに伝達することに焦点を当てている。特定のサンプリングパターンを測定行列に埋め込み、センシングしながら境界情報を得る。非特許文献7では、得られた情報に In Non-Patent Document 7, a partial modification of the measurement matrix to generate intra prediction candidates is proposed by combining the concept of intra prediction borrowed from H.264/AVC with measurement coding (Modified SRM). It is a four-way intra prediction approach using a partially modified random binary measurement matrix, and the work mainly focuses on transmitting the coded measurements to the endpoint. A specific sampling pattern is embedded in the measurement matrix to obtain boundary information while sensing. In Non-Patent Document 7, the obtained information is used to

Figure 0007620308000019
を乗算し、予測テンプレートを生成する。SQ符号化、DPCM符号化、SDPC符号化と比較して軽量なアプローチである。しかし、DPCM符号化やSDPC符号化よりもビットレートを低くすることができなかった。この提案は、最先端の研究に比べて予測候補生成の複雑さを低減できるが、測定行列の修正により視覚的品質の大幅な劣化を引き起こし、RIP条件及びその逆変換を満たすことができなかった。
Figure 0007620308000019
to generate a prediction template. This is a lightweight approach compared to SQ coding, DPCM coding, and SDPC coding. However, it is not possible to reduce the bit rate below DPCM coding and SDPC coding. Although this proposal can reduce the complexity of prediction candidate generation compared to state-of-the-art research, it causes a significant degradation of visual quality due to the modification of the measurement matrix, and it cannot meet the RIP condition and its inverse transformation.

A. Zymnis, S. Boyd and E. Candes, "Compressed Sensing With Quantized Measurements," in IEEE Signal Processing Letters, vol. 17, no. 2, pp. 149-152, Feb. 2010, doi: 10.1109/LSP.2009.2035667A. Zymnis, S. Boyd and E. Candes, "Compressed Sensing With Quantized Measurements," in IEEE Signal Processing Letters, vol. 17, no. 2, pp. 149-152, Feb. 2010, doi: 10.1109/LSP. 2009.2035667 W. Dai and O. Milenkovic. Information Theoretical and Algorithmic Approaches to Quantized Compressive Sensing. IEEE Transactions on Communications, 59(7):1857-1866, 2011W. Dai and O. Milenkovic. Information Theoretical and Algorithmic Approaches to Quantized Compressive Sensing. IEEE Transactions on Communications, 59(7):1857-1866, 2011 S. Mun and J. E. Fowler, "DPCM for quantized block-based compressed sensing of images," 2012 Proceedings of the 20th European Signal Processing Conference (EUSIPCO), Bucharest, 2012, pp. 1424-1428S. Mun and J. E. Fowler, "DPCM for quantized block-based compressed sensing of images," 2012 Proceedings of the 20th European Signal Processing Conference (EUSIPCO), Bucharest, 2012, pp. 1424-1428 Yifu Zhang, Shunliang Mei, Quqing Chen and Zhibo Chen, "A novel image/video coding method based on Compressed Sensing theory," 2008 IEEE International Conference on Acoustics, Speech and Signal Processing, Las Vegas, NV, 2008, pp. 1361-1364, doi: 10.1109/ICASSP.2008.4517871Yifu Zhang, Shunliang Mei, Quqing Chen and Zhibo Chen, "A novel image/video coding method based on Compressed Sensing theory," 2008 IEEE International Conference on Acoustics, Speech and Signal Processing, Las Vegas, NV, 2008, pp. 1361- 1364, doi: 10.1109/ICASSP.2008.4517871 C. Zhao, H. Bai and Y. Zhao, "Optimized Measurements Coding for Compressive Sensing Reconstruction Network," 2018 14th IEEE International Conference on Signal Processing (ICSP), Beijing, China, 2018, pp. 596-599, doi: 10.1109/ICSP.2018.8652427C. Zhao, H. Bai and Y. Zhao, "Optimized Measurements Coding for Compressive Sensing Reconstruction Network," 2018 14th IEEE International Conference on Signal Processing (ICSP), Beijing, China, 2018, pp. 596-599, doi: 10.1109 /ICSP.2018.8652427 J. Zhang, D. Zhao and F. Jiang, "Spatially directional predictive coding for block-based compressive sensing of natural images," 2013 IEEE International Conference on Image Processing, Melbourne, VIC, 2013, pp. 1021-1025, doi: 10.1109/ICIP.2013.6738211J. Zhang, D. Zhao and F. Jiang, "Spatially directional predictive coding for block-based compressive sensing of natural images," 2013 IEEE International Conference on Image Processing, Melbourne, VIC, 2013, pp. 1021-1025, doi: 10.1109/ICIP.2013.6738211 J. Zhou, D. Zhou, L. Guo, Y. Takeshi and S. Goto, "Measurement-domain intra prediction framework for compressively sensed images," 2017 IEEE International Symposium on Circuits and Systems (ISCAS), Baltimore, MD, 2017, pp. 1-4, doi: 10.1109/ISCAS.2017.8050262J. Zhou, D. Zhou, L. Guo, Y. Takeshi and S. Goto, "Measurement-domain intra prediction framework for compressively sensed images," 2017 IEEE International Symposium on Circuits and Systems (ISCAS), Baltimore, MD, 2017 , pp. 1-4, doi: 10.1109/ISCAS.2017.8050262

本発明は、圧縮センシングを用いる場合において、画質の劣化を抑制しつつ、画像を効率的に圧縮可能とするイメージング装置及び測定符号化装置を提供することを目的とする。 The present invention aims to provide an imaging device and a measurement encoding device that can efficiently compress images while suppressing degradation of image quality when using compressed sensing.

第1の態様に係るイメージング装置は、画像ブロック単位で画像出力を行うイメージセンサ部と、前記画像ブロックを構成するn画素の画素値にm行n列(m<n)の測定行列を適用してm個の測定値を出力する圧縮センシング処理を行う圧縮センシング部と、前記m個の測定値に対してアナログ/デジタル変換処理を行うことにより測定データを出力するアナログ/デジタル変換部とを備える。前記圧縮センシング部は、NoH(Naturally ordered Hadamard)行列の各行をシーケンシー順に並べたSoWH(Sequency ordered Walsh-Hadamard)行列に基づくCoWH(Continuously ordered Walsh-Hadamard)行列を前記測定行列として用いて、前記圧縮センシング処理を行う。前記CoWH行列の各行は、前記画像ブロックに投影したときの投影パターンが互いに異なる。前記CoWH行列は、前記CoWH行列における上側の行から下側の行に向かうにつれて、前記投影パターンにおいて同値の要素が連続する数が少なくなるように構成されている。 The imaging device according to the first aspect includes an image sensor unit that outputs an image in units of an image block, a compressed sensing unit that performs a compressed sensing process by applying a measurement matrix with m rows and n columns (m<n) to pixel values of n pixels that constitute the image block to output m measured values, and an analog/digital conversion unit that outputs measurement data by performing an analog/digital conversion process on the m measured values. The compressed sensing unit performs the compressed sensing process using a CoWH (Continuously ordered Walsh-Hadamard) matrix based on a SoWH (Sequency ordered Walsh-Hadamard) matrix in which each row of a NoH (Naturally ordered Hadamard) matrix is arranged in sequential order as the measurement matrix. Each row of the CoWH matrix has a different projection pattern when projected onto the image block. The CoWH matrix is configured such that the number of consecutive elements with the same value in the projection pattern decreases from the upper row to the lower row in the CoWH matrix.

第2の態様に係る測定符号化装置は、第1の態様に係るイメージング装置と、前記画像ブロックの上側に隣接する上側隣接ブロックを用いた垂直予測モードと前記画像ブロックの左側に隣接する左側隣接ブロックを用いた水平予測モードとを含む複数のイントラ予測モードのいずれか1つを用いて、前記画像ブロックの前記測定データを予測した予測測定データを出力するイントラ予測部と、前記画像ブロックの前記測定データと前記イントラ予測部が出力する前記予測測定データとの差分を表す残差データに対して量子化処理を行う量子化部とを備える。 The measurement coding device according to the second aspect includes the imaging device according to the first aspect, an intra prediction unit that outputs predicted measurement data obtained by predicting the measurement data of the image block using one of a plurality of intra prediction modes including a vertical prediction mode using an upper adjacent block adjacent to the upper side of the image block and a horizontal prediction mode using a left adjacent block adjacent to the left side of the image block, and a quantization unit that performs a quantization process on residual data representing the difference between the measurement data of the image block and the predicted measurement data output by the intra prediction unit.

本発明によれば、圧縮センシングを用いる場合において、画質の劣化を抑制しつつ、画像を効率的に圧縮可能とするイメージング装置及び測定符号化装置を提供できる。 The present invention provides an imaging device and a measurement encoding device that can efficiently compress images while suppressing degradation of image quality when using compressed sensing.

実施形態に係る測定伝送システムの構成を示す図である。FIG. 1 is a diagram illustrating a configuration of a measurement transmission system according to an embodiment. 実施形態に係る測定符号化装置の構成を示す図である。FIG. 1 is a diagram illustrating a configuration of a measurement encoding device according to an embodiment. 実施形態に係る圧縮センシング部の動作を示す図である。FIG. 4 is a diagram illustrating an operation of a compressed sensing unit according to the embodiment. 実施形態に係る垂直予測モード及び水平予測モードを示す図である。FIG. 2 is a diagram illustrating vertical prediction modes and horizontal prediction modes according to an embodiment. 実施形態に係るイメージング装置の構成例を示す図である。FIG. 1 is a diagram illustrating an example of the configuration of an imaging apparatus according to an embodiment. 実施形態に係る測定行列の投影パターンを示す図である。FIG. 13 is a diagram illustrating a projection pattern of a measurement matrix according to an embodiment. 実施形態に係るCoWH行列の生成アルゴリズムを示す図である。FIG. 13 is a diagram illustrating a CoWH matrix generation algorithm according to an embodiment. NoH行列、SoWH行列、及びCoWH行列のそれぞれを用いた場合においてl最小化及び逆高速ウォルシュ・アダマール変換(IFWHT)を用いた復元結果を比較して示す図である。FIG. 11 is a diagram showing a comparison of restoration results using l1 minimization and the inverse fast Walsh-Hadamard transform (IFWHT) when a NoH matrix, a SoWH matrix, and a CoWH matrix are used, respectively. 実施形態に係る符号化装置の一部の構成例を示す図である。FIG. 2 is a diagram illustrating an example of the configuration of a portion of an encoding device according to an embodiment. 実施形態に係る測定復号装置の構成を示す図である。FIG. 2 is a diagram illustrating a configuration of a measurement decoding device according to an embodiment. 実施形態に係る作用・効果を説明するための図である。FIG. 11 is a diagram for explaining the operation and effect of the embodiment.

図面を参照して、実施形態に係る測定伝送システムについて説明する。以下の図面の記載において、同一又は類似の部分には同一又は類似の符号を付している。 The measurement transmission system according to the embodiment will be described with reference to the drawings. In the following description of the drawings, the same or similar parts are denoted by the same or similar reference numerals.

(1)測定伝送システムの構成
まず、本実施形態に係る測定伝送システムの構成について説明する。図1は、本実施形態に係る測定伝送システム1の構成を示す図である。図1に示すように、測定伝送システム1は、測定符号化装置100と、測定復号装置200とを有する。
(1) Configuration of the measurement transmission system First, the configuration of the measurement transmission system according to this embodiment will be described. Fig. 1 is a diagram showing the configuration of a measurement transmission system 1 according to this embodiment. As shown in Fig. 1, the measurement transmission system 1 has a measurement encoding device 100 and a measurement decoding device 200.

測定符号化装置100は、画像センシングにより画像データを生成するとともに、画像データを圧縮センシングにより圧縮する。そして、測定符号化装置100は、圧縮センシングにより圧縮された測定データを圧縮符号化によりさらに圧縮し、圧縮された符号化データ(ビットストリーム)を、伝送路を介して送信する。例えば、伝送路は無線伝送路である。伝送路は、有線伝送路を含んでもよい。 The measurement coding device 100 generates image data by image sensing and compresses the image data by compressed sensing. The measurement coding device 100 then further compresses the measurement data compressed by compressed sensing by compression coding, and transmits the compressed coded data (bit stream) via a transmission path. For example, the transmission path is a wireless transmission path. The transmission path may also include a wired transmission path.

測定復号装置200は、圧縮された符号化データを測定符号化装置100から受信し、受信した符号化データから測定データを復号する。そして、測定復号装置200は、復元アルゴリズムを用いて測定データから元の画像データを復元し、例えばディスプレイに対して画像データを出力する。 The measurement decoding device 200 receives the compressed encoded data from the measurement encoding device 100 and decodes the measurement data from the received encoded data. The measurement decoding device 200 then uses a restoration algorithm to restore the original image data from the measurement data and outputs the image data to, for example, a display.

測定伝送システム1は、遠隔監視システムを構成してもよい。例えば、測定符号化装置100がバッテリ駆動型のセンシングデバイスであって、測定復号装置200がサーバに設けられてもよい。サーバは、測定符号化装置100から画像データを収集し、監視対象に対する遠隔監視を行ってもよい。このようなセンシングデバイスは、駆動時間を延長するために低消費電力であることが要求される。 The measurement transmission system 1 may constitute a remote monitoring system. For example, the measurement encoding device 100 may be a battery-powered sensing device, and the measurement decoding device 200 may be provided in a server. The server may collect image data from the measurement encoding device 100 and perform remote monitoring of the monitoring target. Such sensing devices are required to have low power consumption in order to extend their operating time.

なお、図1において、測定符号化装置100を1つのみ図示しているが、測定復号装置200は、複数の測定符号化装置100から符号化データを受信してもよい。 Note that although only one measurement encoding device 100 is shown in FIG. 1, the measurement decoding device 200 may receive encoded data from multiple measurement encoding devices 100.

また、測定符号化装置100から測定復号装置200への符号化データの伝送は、伝送路を介して行われる場合に限定されるものではなく、記憶媒体を介して測定符号化装置100から測定復号装置200へ間接的に符号化データが伝送されてもよい。 In addition, the transmission of encoded data from the measurement encoding device 100 to the measurement decoding device 200 is not limited to being performed via a transmission path, and the encoded data may be transmitted indirectly from the measurement encoding device 100 to the measurement decoding device 200 via a storage medium.

(2)測定符号化装置
次に、本実施形態に係る測定符号化装置100について説明する。
(2) Measurement Encoding Apparatus Next, the measurement encoding apparatus 100 according to this embodiment will be described.

(2.1)測定符号化装置の全体構成
図2は、本実施形態に係る測定符号化装置100の構成を示す図である。
(2.1) Overall Configuration of Measurement Encoding Apparatus FIG. 2 is a diagram showing the configuration of a measurement encoding apparatus 100 according to this embodiment.

図2に示すように、測定符号化装置100は、イメージング装置110と、符号化装置120と、送信部130とを有する。イメージング装置110、符号化装置120、及び送信部130は、別体に構成されていてもよいし、一体に構成されていてもよい。測定符号化装置100は、図示を省略するバッテリを有していてもよい。 As shown in FIG. 2, the measurement coding device 100 has an imaging device 110, a coding device 120, and a transmission unit 130. The imaging device 110, the coding device 120, and the transmission unit 130 may be configured separately or integrally. The measurement coding device 100 may have a battery (not shown).

イメージング装置110は、イメージセンサ部111と、圧縮センシング部112と、アナログ/デジタル(A/D)変換部113とを有する。 The imaging device 110 has an image sensor unit 111, a compressed sensing unit 112, and an analog/digital (A/D) conversion unit 113.

イメージセンサ部111は、画像ブロック単位で画像出力を行う。イメージセンサ部111は、CMOSイメージセンサ(CIS)を含んで構成される。但し、イメージセンサ部111は、CCDイメージセンサを含んで構成されてもよい。 The image sensor unit 111 outputs images in units of image blocks. The image sensor unit 111 includes a CMOS image sensor (CIS). However, the image sensor unit 111 may also include a CCD image sensor.

圧縮センシング部112は、イメージセンサ部111が出力する画像ブロックを構成するn画素の画素値にm行n列(m<n)の測定行列を適用してm個の測定値を出力する。このような処理は、画素ドメインから測定ドメインへの変換処理に相当する。 The compressed sensing unit 112 outputs m measurement values by applying a measurement matrix with m rows and n columns (m<n) to the pixel values of n pixels that make up the image block output by the image sensor unit 111. This type of processing corresponds to a conversion process from the pixel domain to the measurement domain.

図3は、本実施形態に係る圧縮センシング部112の動作を示す図である。図3に示すように、1つの画像が複数の画像ブロックに分割され、ラスタースキャン順で画像ブロックが取得される。各画像ブロックは、n画素(n個の画素)分の画素値からなる。圧縮センシング部112は、各画像ブロックからラスタースキャン順で画素値を取得する。 Figure 3 is a diagram showing the operation of the compressed sensing unit 112 according to this embodiment. As shown in Figure 3, one image is divided into multiple image blocks, and the image blocks are acquired in raster scan order. Each image block consists of pixel values for n pixels (n pixels). The compressed sensing unit 112 acquires pixel values from each image block in raster scan order.

図3において、画像ブロックBに対応する画素値列Xと、画像ブロックBに対応する画素値列Xと、画像ブロックBに対応する画素値列Xと、画像ブロックBに対応する画素値列Xとを例示している。画素値列は、n個の画素値(x乃至x)からなる。 3, pixel value sequence X1 corresponding to image block B1 , pixel value sequence X2 corresponding to image block B2 , pixel value sequence X3 corresponding to image block B3 , and pixel value sequence Xi corresponding to image block Bi are illustrated. The pixel value sequence is made up of n pixel values ( x1 to xn ).

圧縮センシング部112は、各画素値列Xにm行n列の測定行列(Measurement Matrix)を乗算して出力する。これにより、各画素値列Xは、m個の測定値(y乃至y)からなる測定値列Yに変換される。ここで、mはnよりも小さいため、データ量が圧縮されることになる。 The compressed sensing unit 112 multiplies each pixel value sequence X by a measurement matrix with m rows and n columns, and outputs the result. As a result, each pixel value sequence X is converted into a measurement value sequence Y consisting of m measurement values ( y1 to ym ). Here, since m is smaller than n, the amount of data is compressed.

図2に戻り、A/D変換部113は、圧縮センシング部112が出力するm個の測定値Yに対してA/D変換処理を行うことにより、デジタル信号である測定データYを出力する。圧縮センシングにより測定値の数が削減(圧縮)されているため、A/D変換部113の消費電力を低く抑えることができる。 Returning to FIG. 2, the A/D conversion unit 113 performs A/D conversion processing on the m measurement values Y output by the compressed sensing unit 112, thereby outputting measurement data Y, which is a digital signal. Because the number of measurement values is reduced (compressed) by compressed sensing, the power consumption of the A/D conversion unit 113 can be kept low.

A/D変換部113が出力する各画像ブロックの測定データYは、符号化装置120により、イントラ予測を用いた圧縮符号化によりさらに圧縮される。符号化装置120は、イントラ予測部121と、残差データ生成部122と、量子化部123と、ハフマン符号化部124と、ハフマン復号部125と、逆量子化部126と、合成部127とを有する。 The measurement data Y of each image block output by the A/D conversion unit 113 is further compressed by the encoding device 120 through compression encoding using intra prediction. The encoding device 120 has an intra prediction unit 121, a residual data generation unit 122, a quantization unit 123, a Huffman encoding unit 124, a Huffman decoding unit 125, an inverse quantization unit 126, and a synthesis unit 127.

イントラ予測部121は、複数のイントラ予測モードのいずれか1つを用いて、現画像ブロックの測定データYを予測した予測測定データYを出力する。複数のイントラ予測モードは、図4に示すように、現画像ブロックの上側に隣接する上側隣接ブロックを用いた垂直予測モードと、現画像ブロックの左側に隣接する左側隣接ブロックを用いた水平予測モードとを含む。複数の予測モードは、垂直予測モードの予測測定データと水平予測モードの予測測定データとの平均を予測測定データとして算出する平均予測モードをさらに含む。 The intra prediction unit 121 outputs predicted measurement data Yp obtained by predicting measurement data Y of the current image block using any one of a plurality of intra prediction modes. The plurality of intra prediction modes include a vertical prediction mode using an upper adjacent block adjacent to the upper side of the current image block, and a horizontal prediction mode using a left adjacent block adjacent to the left side of the current image block, as shown in Fig. 4. The plurality of prediction modes further includes an average prediction mode that calculates an average of the predicted measurement data of the vertical prediction mode and the predicted measurement data of the horizontal prediction mode as predicted measurement data.

イントラ予測部121は、参照データ生成部1211と、予測データ生成部1212と、選択部1213とを有する。 The intra prediction unit 121 has a reference data generation unit 1211, a prediction data generation unit 1212, and a selection unit 1213.

参照データ生成部1211は、予測測定データを得るために、上側隣接ブロックの参照データと左側隣接ブロックの参照データとを生成する。 The reference data generation unit 1211 generates reference data for the upper adjacent block and reference data for the left adjacent block to obtain predicted measurement data.

予測データ生成部1212は、参照データ生成部1211が生成する参照データを用いて、垂直予測モードの予測測定データYと、水平予測モードの予測測定データYと、平均予測モードの予測測定データYavgとを生成する。 The predicted data generating unit 1212 uses the reference data generated by the reference data generating unit 1211 to generate predicted measurement data Yv in the vertical prediction mode, predicted measurement data Yh in the horizontal prediction mode, and predicted measurement data Yavg in the average prediction mode.

選択部1213は、垂直予測モードの予測測定データYと、水平予測モードの予測測定データYと、平均予測モードの予測測定データYavgとのそれぞれについて、現画像ブロックの測定データYとの類似度を算出することにより、類似度が最も高い予測測定データを選択し、選択した予測測定データYを残差データ生成部122に出力する。類似度を表す指標値としては、例えば、絶対値差分和(SAD:Sum of Absolute Difference)を用いることができる。 The selection unit 1213 calculates the similarity between the measurement data Y of the current image block and each of the predicted measurement data Yv of the vertical prediction mode, the predicted measurement data Yh of the horizontal prediction mode, and the predicted measurement data Yavg of the average prediction mode, and selects the predicted measurement data with the highest similarity, and outputs the selected predicted measurement data Yp to the residual data generation unit 122. As an index value representing the similarity, for example, the sum of absolute differences (SAD) can be used.

但し、いずれの予測測定データも現画像ブロックの測定データYとの類似度が低い場合、選択部1213は、現画像ブロックの測定データYをそのまま量子化部123に出力してもよい。例えば、選択部1213は、垂直予測モードの予測測定データYと、水平予測モードの予測測定データYと、平均予測モードの予測測定データYavgとのそれぞれのSADが閾値よりも大きい場合、現画像ブロックの測定データYをそのまま量子化部123に出力する。 However, if the similarity of any of the predicted measurement data with the measurement data Y of the current image block is low, the selection unit 1213 may output the measurement data Y of the current image block as is to the quantization unit 123. For example, if the SAD of each of the predicted measurement data Yv of the vertical prediction mode, the predicted measurement data Yh of the horizontal prediction mode, and the predicted measurement data Yavg of the average prediction mode is greater than a threshold, the selection unit 1213 outputs the measurement data Y of the current image block as is to the quantization unit 123.

残差データ生成部122は、現画像ブロックの測定データYとイントラ予測部121が出力する予測測定データYとの差分を表す残差データYを生成し、生成した残差データYを量子化部123に出力する。 The residual data generation unit 122 generates residual data Yr representing the difference between the measurement data Y of the current image block and the predicted measurement data Yp output by the intra prediction unit 121 , and outputs the generated residual data Yr to the quantization unit 123 .

量子化部123は、残差データY(又は現画像ブロックの測定データY)に対して量子化処理を行い、量子化データYをハフマン符号化部124に出力する。 The quantization unit 123 performs a quantization process on the residual data Y r (or the measurement data Y of the current image block), and outputs the quantized data Y q to the Huffman coding unit 124 .

ハフマン符号化部124は、量子化データYに対してハフマン符号化処理を行うことにより符号化データを生成し、生成した符号化データを送信部130及びハフマン復号部125に出力する。なお、ハフマン符号化に限定されるものではなく、ハフマン符号化以外のエントロピー符号化を用いてもよい。 The Huffman coding unit 124 generates coded data by performing a Huffman coding process on the quantized data Yq , and outputs the generated coded data to the transmission unit 130 and the Huffman decoding unit 125. Note that the coding is not limited to Huffman coding, and entropy coding other than Huffman coding may be used.

送信部130は、ハフマン符号化部124が出力する符号化データを、伝送路を介して測定復号装置200に送信する。送信部130は、符号化データを含む無線信号を送信する無線送信機を含んでもよい。また、送信部130は、選択部1213が選択した予測モードを示すモード情報を符号化データに含めて送信する。 The transmitting unit 130 transmits the coded data output by the Huffman coding unit 124 to the measurement decoding device 200 via a transmission path. The transmitting unit 130 may include a wireless transmitter that transmits a wireless signal including the coded data. The transmitting unit 130 also transmits the coded data including mode information indicating the prediction mode selected by the selecting unit 1213.

ハフマン復号部125は、ハフマン符号化部124が出力する符号化データに対してハフマン復号処理を行うことにより量子化データYを復元し、復元した量子化データYを逆量子化部126に出力する。 The Huffman decoding unit 125 performs Huffman decoding processing on the coded data output by the Huffman coding unit 124 to restore the quantized data Yq , and outputs the restored quantized data Yq to the inverse quantization unit 126 .

逆量子化部126は、復元量子化データYに対して逆量子化処理を行うことにより残差データYを復元し、復元残差データYdeqを合成部127に出力する。 The inverse quantization unit 126 performs an inverse quantization process on the restored quantized data Yq to restore the residual data Yr , and outputs the restored residual data Ydeq to the synthesis unit 127.

合成部127は、復元残差データYdeqと予測測定データYとを合成することにより測定データYを復元し、復元測定データをイントラ予測部121の参照データ生成部1211に出力する。 The synthesis unit 127 reconstructs the measurement data Y by synthesizing the reconstructed residual data Y deq and the predicted measurement data Y p , and outputs the reconstructed measurement data to the reference data generation unit 1211 of the intra prediction unit 121 .

なお、図2に示す符号化装置120の構成例において、ハフマン符号化部124が出力する符号化データをハフマン復号部125に入力している。しかしながら、ハフマン復号部125を不要としてもよい。この場合、ハフマン符号化部124が出力する符号化データをハフマン復号部125に入力することに代えて、量子化部123が出力する量子化データYを逆量子化部126に入力する構成になる。 In the exemplary configuration of the encoding device 120 shown in Fig. 2, the encoded data output by the Huffman encoding unit 124 is input to the Huffman decoding unit 125. However, the Huffman decoding unit 125 may be unnecessary. In this case, instead of inputting the encoded data output by the Huffman encoding unit 124 to the Huffman decoding unit 125, the quantized data Yq output by the quantization unit 123 is input to the inverse quantization unit 126.

(2.2)イメージング装置
次に、本実施形態に係るイメージング装置110について説明する。
(2.2) Imaging Device Next, the imaging device 110 according to this embodiment will be described.

図5は、本実施形態に係るイメージング装置110の構成例を示す図である。本実施形態に係るイメージング装置110は、圧縮センシングを用いるCMOSイメージセンサ、すなわち、CS-CISである。 Figure 5 is a diagram showing an example of the configuration of an imaging device 110 according to this embodiment. The imaging device 110 according to this embodiment is a CMOS image sensor that uses compressed sensing, i.e., a CS-CIS.

図5に示すように、イメージング装置110は、画素アレイ(Pixel Array)111aと、行選択部(ROW SELECTOR)111bと、列選択部(COLUMN SELECTOR)111cと、行列演算トリガ部112aと、行列演算部112bと、A/D変換部113とを有する。 As shown in FIG. 5, the imaging device 110 has a pixel array 111a, a row selection unit 111b, a column selection unit 111c, a matrix operation trigger unit 112a, a matrix operation unit 112b, and an A/D conversion unit 113.

画素アレイ111a、行選択部111b、及び列選択部111cは、図2に示すイメージセンサ部111を構成する。画素アレイ111aは、アレイ状に配置された複数の画素を有する。各画素は、光を受けて、電気信号である画素値を出力する。画素アレイ111aは、n個の画素からなるブロック単位に区分されている。行選択部111b及び列選択部111cは、画素値を読み出す画素を選択し、選択した画素から画素値を読み出す。 The pixel array 111a, row selection unit 111b, and column selection unit 111c constitute the image sensor unit 111 shown in FIG. 2. The pixel array 111a has a plurality of pixels arranged in an array. Each pixel receives light and outputs a pixel value, which is an electrical signal. The pixel array 111a is divided into blocks each consisting of n pixels. The row selection unit 111b and the column selection unit 111c select pixels from which pixel values are to be read, and read the pixel values from the selected pixels.

行列演算トリガ部112a及び行列演算部112bは、図2に示す圧縮センシング部112を構成する。行列演算トリガ部112aは、n個の画素からなる画素値列Xに対する行列演算をトリガする。行列演算部112bは、画素値列Xに対して、測定行列を用いた行列演算を行い、m個の測定値からなる測定値列YをA/D変換部113に出力する。A/D変換部113は、測定値列Yをデジタル信号に変換し、測定データYを出力する。 The matrix operation trigger unit 112a and the matrix operation unit 112b constitute the compressed sensing unit 112 shown in FIG. 2. The matrix operation trigger unit 112a triggers a matrix operation on a pixel value sequence X consisting of n pixels. The matrix operation unit 112b performs a matrix operation on the pixel value sequence X using a measurement matrix, and outputs a measurement value sequence Y consisting of m measurement values to the A/D conversion unit 113. The A/D conversion unit 113 converts the measurement value sequence Y into a digital signal, and outputs measurement data Y.

図6は、本実施形態に係る測定行列の投影パターンを示す図である。ここでは、画像ブロックのサイズが8画素×8画素、すなわち、nの値が64あるものとする。また、mの値が8(図にLow frequency からhigh frequency まで8つのパターンがある)、すなわち、n=64から8個の測定値(m=8)に変換する、12.5%(m/n=8/64=12.5%)まで圧縮時に使う8つのパターンを示す。図6において、白抜きの各領域は測定行列における要素の値が「1」であることを表し、黒塗りの領域は測定行列における要素の値が「0」であることを表す。 Figure 6 shows the projection pattern of the measurement matrix according to this embodiment. Here, the size of the image block is 8 pixels x 8 pixels, i.e., the value of n is 64. Also, the value of m is 8 (there are eight patterns in the figure, from low frequency to high frequency), i.e., eight patterns are shown for use when compressing to 12.5% (m/n=8/64=12.5%), converting from n=64 to eight measurement values (m=8). In Figure 6, each open area represents an element value of "1" in the measurement matrix, and each filled area represents an element value of "0" in the measurement matrix.

図6に示すように、圧縮センシング部112は、NoH(Naturally ordered Hadamard)行列の各行をシーケンシー順に並べたSoWH(Sequency ordered Walsh-Hadamard)行列に基づくCoWH(Continuously ordered Walsh-Hadamard)行列を測定行列として用いて、圧縮センシング処理を行う。なお、シーケンシーとは、行列の1つの行において値が切り替わる頻度(周波数)をいう。 As shown in FIG. 6, the compressed sensing unit 112 performs compressed sensing processing using a CoWH (Continuously ordered Walsh-Hadamard) matrix as a measurement matrix based on a SoWH (Sequency ordered Walsh-Hadamard) matrix in which each row of a NoH (Naturally ordered Hadamard) matrix is arranged in sequential order. Note that sequence refers to the frequency at which values change in one row of the matrix.

CoWH行列の各行は、画像ブロックに投影したときの投影パターンが互いに異なる。CoWH行列は、CoWH行列における上側の行から下側の行に向かうにつれて、投影パターンにおいて同値の要素が連続する数が少なくなるように構成されている。 Each row of the CoWH matrix has a different projection pattern when projected onto an image block. The CoWH matrix is constructed so that the number of consecutive elements with the same value in the projection pattern decreases from the upper rows to the lower rows in the CoWH matrix.

例えば、CoWH行列の最も上側の行(行#1)は、投影パターンにおいて、要素「1」が64画素分だけ連続している。行#1を用いて算出される測定値をyと呼ぶ。 For example, the top row (row #1) of the CoWH matrix has 64 consecutive pixels of "1" elements in the projection pattern. The measurement calculated using row #1 is called y1 .

CoWH行列の上から2番目の行(行#2)及び3番目の行(行#3)のそれぞれは、投影パターンにおいて、要素「1」が32画素分だけ連続しており、且つ要素「0」が32画素分だけ連続している。行#2を用いて算出される測定値をyと呼び、行#3を用いて算出される測定値をyと呼ぶ。 In the second row (row #2) and the third row (row #3) from the top of the CoWH matrix, the element "1" is consecutive for 32 pixels and the element "0" is consecutive for 32 pixels in the projection pattern. The measurement calculated using row #2 is called y2 , and the measurement calculated using row #3 is called y3 .

CoWH行列の上から4番目の行(行#4)は、投影パターンにおいて、要素「1」が16画素分だけ連続しており、且つ要素「0」が32画素分だけ連続している。 In the fourth row from the top of the CoWH matrix (row #4), the element "1" occurs consecutively for 16 pixels, and the element "0" occurs consecutively for 32 pixels in the projection pattern.

CoWH行列の上から5番目の行(行#5)は、投影パターンにおいて、要素「1」が16画素分だけ連続しており、且つ要素「0」が16画素分だけ連続している。 In the fifth row from the top (row #5) of the CoWH matrix, the element "1" occurs consecutively for 16 pixels in the projection pattern, and the element "0" occurs consecutively for 16 pixels.

CoWH行列の上から6番目の行(行#6)は、投影パターンにおいて、要素「1」が16画素分だけ連続しており、且つ要素「0」が32画素分だけ連続している。 In the sixth row from the top of the CoWH matrix (row #6), the element "1" occurs consecutively for 16 pixels, and the element "0" occurs consecutively for 32 pixels in the projection pattern.

CoWH行列の上から7番目の行(行#7)は、投影パターンにおいて、要素「1」が16画素分だけ連続しており、且つ要素「0」が16画素分だけ連続している。 In the seventh row from the top of the CoWH matrix (row #7), the element "1" occurs consecutively for 16 pixels, and the element "0" occurs consecutively for 16 pixels in the projection pattern.

CoWH行列の上から8番目の行(行#8)は、投影パターンにおいて、要素「1」が8画素分だけ連続する領域及び要素「1」が16画素分だけ連続する領域を有する。また、要素「0」が8画素分だけ連続する領域及び要素「0」が16画素分だけ連続する領域を有する。 The eighth row from the top (row #8) of the CoWH matrix has an area in the projection pattern where the element "1" is continuous for 8 pixels and an area where the element "1" is continuous for 16 pixels. It also has an area where the element "0" is continuous for 8 pixels and an area where the element "0" is continuous for 16 pixels.

CoWH行列は、画像ブロックの全画素値を取得する第1投影パターンを構成する行と、画像ブロックの上半分の画素値を取得する第2投影パターンを構成する行と、画像ブロックの左半分の画素値を取得する第3投影パターンを構成する行とを有する。これにより、測定ドメインにおける垂直予測モード及び水平予測モードのイントラ予測を円滑に行うことが可能になる。具体的には、CoWH行列における最も上側の行(行#1)は、第1投影パターンを構成し、CoWH行列における上から2番目及び3番目の行(行#2及び#3)は、第2投影パターン及び第3投影パターンを構成する。 The CoWH matrix has rows constituting a first projection pattern that obtains all pixel values of an image block, rows constituting a second projection pattern that obtains pixel values of the upper half of the image block, and rows constituting a third projection pattern that obtains pixel values of the left half of the image block. This enables smooth intra-prediction of the vertical prediction mode and the horizontal prediction mode in the measurement domain. Specifically, the topmost row (row #1) in the CoWH matrix constitutes the first projection pattern, and the second and third rows from the top (rows #2 and #3) in the CoWH matrix constitute the second and third projection patterns.

なお、CS理論をCISに採用することにより、測定行列 In addition, by adopting CS theory to CIS, the measurement matrix

Figure 0007620308000020
は、スクランブルマスクの確率が高いバイナリ{0,1}又はワーストケースでも相補{-1,1}でなければならないという実装上の制約がある。
Figure 0007620308000020
There is an implementation constraint that the scrambling mask must be highly probable binary {0,1} or in the worst case complementary {−1,1}.

本実施形態に係る連続順序のウォルシュ・アダマール(CoWH)は、自然順序のアダマール(NoH)によって導き出すことができるバイナリシーケンシー順序のウォルシュ・アダマール(SoWH)を最適化したものである。なお、NoH行列及びSoWH行列の列は直交している。これらの行列は、n次の行列 The continuous order Walsh-Hadamard (CoWH) of this embodiment is an optimization of the binary sequential order Walsh-Hadamard (SoWH) that can be derived by the natural order Hadamard (NoH). Note that the columns of the NoH matrix and the SoWH matrix are orthogonal. These matrices are n-th order matrices.

Figure 0007620308000021
を与えることによって得ることができる。NoH行列は次のように表現できる。
Figure 0007620308000021
The NoH matrix can be expressed as follows:

Figure 0007620308000022
ここで、In×nは単位行列である。
Figure 0007620308000022
Here, I n×n is the identity matrix.

Figure 0007620308000023
は、
Figure 0007620308000024
の転置であり、その次数はXの次元に等しくなければならない。これは、図6(a)に示すような投影パターンを生じる。これは繰り返し適用することができ、次のように、n次の
Figure 0007620308000023
teeth,
Figure 0007620308000024
, the order of which must be equal to the dimension of X. This results in a projection pattern as shown in FIG. 6(a). This can be applied repeatedly to produce a projection pattern of order n as follows:

Figure 0007620308000025
に対してSylvester's constructionを適用することにより次の行列のシーケンスにつながり、これはウォルシュ・アダマール行列と呼ばれ、次のように表現できる。
Figure 0007620308000025
Applying Sylvester's construction to leads to the following sequence of matrices, known as Walsh-Hadamard matrices, which can be expressed as:

Figure 0007620308000026
但し、
Figure 0007620308000026
however,

Figure 0007620308000027
であり、
Figure 0007620308000027
and

Figure 0007620308000028
はクロネッカー積である。その結果、図6(b)に示すような投影パターンを生じる。
Figure 0007620308000028
is the Kronecker product. This results in the projection pattern shown in FIG.

ウォルシュ・アダマール行列のシーケンシー順の行は、ビット反転及びgray-code permutationを適用することによってNoH行列から導き出される。これにより、 The sequential rows of the Walsh-Hadamard matrix are derived from the NoH matrix by applying bit reversal and gray-code permutation. This results in

Figure 0007620308000029
で表現されるSoWH測定行列が得られる。
Figure 0007620308000029
The SoWH measurement matrix expressed as:

本実施形態では、測定行列の上部に低周波係数をグループ化することで、SoWH測定行列の投影パターンを再編成する。CoWHの配置では、図6(c)に示すように、投影パターンは、接続された要素の数を増やすように編成されている。これにより、センシングしながら測定品質を向上させることができる。関連するコンポーネントは、対応する値を持つ連続した画素のグループに対応し、より豊富な予備知識の点で、復元アルゴリズム及び逆変換に影響を与える。 In this embodiment, we reorganize the projection pattern of the SoWH measurement matrix by grouping low-frequency coefficients at the top of the measurement matrix. In the CoWH arrangement, the projection pattern is organized to increase the number of connected elements, as shown in Figure 6(c). This allows for improved measurement quality while sensing. Related components correspond to groups of contiguous pixels with corresponding values, in terms of richer prior knowledge that influences the restoration algorithm and inverse transformation.

また、図6(c)に示すCoWH行列の良好な連続パターンは、NoH行列及びSoWH行列に比べてSRの下限を延長することを可能にし、これは通常は良好な視覚品質のために50%制限されている。 Also, the good continuity pattern of the CoWH matrix shown in Figure 6(c) allows extending the lower limit of SR compared to NoH and SoWH matrices, which are usually limited by 50% for good visual quality.

CoWH行列は図7に示すアルゴリズムにより生成される。具体的には、i及びjを、

Figure 0007620308000030
の次数とし、探索基準位置(search criteria position)dはn×nに等しい。次に、各dについて、ri,jの除算後の剰余を求める。次数が奇数か偶数かを判定するために、
Figure 0007620308000031
を計算する。各次数についてri,jを求めた後、
Figure 0007620308000032
を再配置するために、Aを空の行列
Figure 0007620308000033
とすると、
Figure 0007620308000034
である。 The CoWH matrix is generated by the algorithm shown in FIG.
Figure 0007620308000030
Let the degree be r i,j, and the search criteria position d is equal to n×n. Then, for each d, find the remainder after division of r i,j . To determine whether the degree is odd or even,
Figure 0007620308000031
After finding r i,j for each degree, calculate
Figure 0007620308000032
To rearrange A, let A be an empty matrix.
Figure 0007620308000033
Then,
Figure 0007620308000034
It is.

A(CoWH行列)は、少なくともの次の確率でRIPを満たす。 A (the CoWH matrix) satisfies the RIP with probability at least .

Figure 0007620308000035
Figure 0007620308000035

ここでβは正の定数である。 where β is a positive constant.

ハードウェア実装のために、この拡張された行列Aを相補の行列からバイナリに二値化している。CoWH行列のサンプリングマスク(投影パターン)は、NoH行列及びSoWH行列に比べて、低周波係数から高周波係数に向けて徐々に配置されている。 For hardware implementation, this expanded matrix A is binarized from its complementary matrix to binary. The sampling mask (projection pattern) of the CoWH matrix is arranged gradually from low-frequency coefficients to high-frequency coefficients compared to the NoH and SoWH matrices.

図8は、NoH行列、SoWH行列、及びCoWH行列のそれぞれを用いた場合においてl最小化及び逆高速ウォルシュ・アダマール変換(IFWHT)を用いた復元結果を比較して示す図である。図8に示すように、CoWH行列は、同一SRでの視覚品質の点でNoH行列及びSoWH行列を上回っている。なお、図8(a)は構成された測定行列を示し、図8(b)は復元画像を示し、図8(c)は400%ズームした結果を示す。なお、n=65536(256画素×256画素であり、m=8192(12.5%まで圧縮された)であり、B(すなわち、BCIで用いるブロックのサイズ)=8ある。 FIG. 8 is a diagram showing a comparison of the restoration results using l 1 minimization and inverse fast Walsh-Hadamard transform (IFWHT) when using NoH matrix, SoWH matrix, and CoWH matrix, respectively. As shown in FIG. 8, the CoWH matrix outperforms NoH matrix and SoWH matrix in terms of visual quality at the same SR. Note that FIG. 8(a) shows the constructed measurement matrix, FIG. 8(b) shows the restored image, and FIG. 8(c) shows the result of 400% zoom. Note that n=65536 (256 pixels×256 pixels), m=8192 (compressed to 12.5%), and B (i.e., the size of the block used in BCI)=8.

(2.3)符号化装置
次に、本実施形態に係る符号化装置120について説明する。図9は、本実施形態に係る符号化装置120の一部の構成例を示す図である。
(2.3) Encoding Device Next, a description will be given of the encoding device 120 according to this embodiment. Fig. 9 is a diagram showing an example of the configuration of a portion of the encoding device 120 according to this embodiment.

図9に示すように、参照データ生成部1211と、予測データ生成部1212と、選択部1213とにより、図2に示すイントラ予測部121が構成される。イントラ予測部121の入力側には、入力バッファ141が設けられる。量子化部123の出力側には、出力バッファ142が設けられる。 As shown in FIG. 9, the reference data generation unit 1211, the prediction data generation unit 1212, and the selection unit 1213 constitute the intra prediction unit 121 shown in FIG. 2. An input buffer 141 is provided on the input side of the intra prediction unit 121. An output buffer 142 is provided on the output side of the quantization unit 123.

参照データ生成部1211は、合成部127が出力する復元測定データYから測定値y、y、yを分離するパッケージスプリッタ1211aと、測定値yから測定値yを減算する減算器1211bと、測定値yから測定値yを減算する減算器1211cと、減算器1211bの出力を記憶するレジスタ1211dと、減算器1211cの出力を記憶するレジスタ1211eとを有する。 The reference data generation unit 1211 includes a package splitter 1211a that separates the measurement values y1 , y2 , and y3 from the restored measurement data Y output by the synthesis unit 127, a subtractor 1211b that subtracts the measurement value y2 from the measurement value y1 , a subtractor 1211c that subtracts the measurement value y3 from the measurement value y1 , a register 1211d that stores the output of the subtractor 1211b, and a register 1211e that stores the output of the subtractor 1211c.

ここで、測定値yは、CoWH行列において画像ブロックの全画素値を取得する投影パターンを構成する行#1により得られた測定値であって、画像ブロックの全画素値の合計に相当する。 Here, the measurement value y1 is the measurement value obtained by row #1 constituting a projection pattern that obtains all pixel values of an image block in the CoWH matrix, and corresponds to the sum of all pixel values of the image block.

測定値yは、CoWH行列において画像ブロックの左半分の画素値を取得する投影パターンを構成する行#2により得られた測定値であって、画像ブロックの左半分の画素値の合計に相当する。 The measurement y2 is the measurement obtained by row #2 constituting the projection pattern that obtains pixel values in the left half of the image block in the CoWH matrix, and corresponds to the sum of the pixel values in the left half of the image block.

測定値yは、CoWH行列において画像ブロックの上半分の画素値を取得する投影パターンを構成する行#3により得られた測定値であって、画像ブロックの上半分の画素値の合計に相当する。 Measurement value y3 is the measurement obtained by row #3 constituting a projection pattern that captures pixel values in the upper half of the image block in the CoWH matrix, and corresponds to the sum of the pixel values in the upper half of the image block.

このため、測定値yから測定値yを減算する減算器1211bの出力は、画像ブロックの右半分の画素値の合計に相当し、これはレジスタ1211dに保持される。この画像ブロックの右半分の画素値の合計は、図4に示す水平予測モードにおける参照データとして用いられる。レジスタ1211dは、現画像ブロックの左側隣接ブロックに対応する参照データだけを保持すればよく、ここではそのサイズを16ビットとしている。 Therefore, the output of subtractor 1211b, which subtracts measurement value y2 from measurement value y1 , corresponds to the sum of pixel values in the right half of the image block, and is held in register 1211d. This sum of pixel values in the right half of the image block is used as reference data in the horizontal prediction mode shown in Figure 4. Register 1211d only needs to hold reference data corresponding to the left adjacent block of the current image block, and its size is set to 16 bits here.

他方、測定値yから測定値yを減算する減算器1211cの出力は、画像ブロックの下半分の画素値の合計に相当し、これはレジスタ1211eに保持される。この画像ブロックの下半分の画素値の合計は、図4に示す垂直予測モードにおける参照データとして用いられる。レジスタ1211eは、現画像ブロックが属する行の1つ上の行に属する各画像ブロックについて参照データを保持する。画像の幅をWとし、画像ブロックのサイズをBとすると、レジスタ1211eは、W/B個のブロック分の参照データを保持する。 On the other hand, the output of the subtractor 1211c, which subtracts the measured value y3 from the measured value y1 , corresponds to the sum of the pixel values of the lower half of the image block, which is stored in the register 1211e. This sum of the pixel values of the lower half of the image block is used as reference data in the vertical prediction mode shown in Figure 4. The register 1211e stores reference data for each image block that belongs to the row one row above the row to which the current image block belongs. If the width of the image is W and the size of the image block is B, the register 1211e stores reference data for W/B blocks.

予測データ生成部1212は、レジスタ1211eが出力する、画像ブロックの下半分の画素値の合計から1画素当たりの画素値(平均値)を算出し、この平均値にCoWH行列の転置 The prediction data generator 1212 calculates the pixel value (average value) per pixel from the sum of the pixel values of the lower half of the image block output by the register 1211e, and then multiplies this average value by the transpose of the CoWH matrix.

Figure 0007620308000036
を乗算することにより、垂直予測モードの予測測定データYを出力する。このようにして、イントラ予測部121は、垂直予測モードについて、上側隣接ブロックについて得られた測定値yから、当該上側隣接ブロックについて得られた測定値yを減算することにより、画素ドメインにおける当該上側隣接ブロックの下半分の合計の画素値を得る処理と、下半分の合計の画素値を有効画素数で除算することにより、当該上側隣接ブロックの下半分の画素値の平均を得る処理と、この平均からCoWH行列に基づいて垂直予測モードの予測測定データYを得る処理とを実行する。
Figure 0007620308000036
In this way, for the vertical prediction mode, the intra prediction unit 121 executes a process of subtracting the measurement value y3 obtained for the upper adjacent block from the measurement value y1 obtained for the upper adjacent block to obtain a total pixel value of the lower half of the upper adjacent block in the pixel domain, a process of dividing the total pixel value of the lower half by the number of valid pixels to obtain an average of the pixel values of the lower half of the upper adjacent block, and a process of obtaining prediction measurement data Yv for the vertical prediction mode from this average based on the CoWH matrix.

また、予測データ生成部1212は、レジスタ1211dが出力する、画像ブロックの右半分の画素値の合計から1画素当たりの画素値(平均値)を算出し、この平均値にCoWH行列の転置 The prediction data generator 1212 also calculates the pixel value (average value) per pixel from the sum of the pixel values in the right half of the image block output by the register 1211d, and applies the transpose of the CoWH matrix to this average value.

Figure 0007620308000037
を乗算することにより、水平予測モードの予測測定データYを出力する。このようにして、イントラ予測部121は、水平予測モードについて、左側隣接ブロックについて得られた測定値yから、左側隣接ブロックについて得られた測定値yを減算することにより、画素ドメインにおける左側隣接ブロックの右半分の合計の画素値を得る処理と、右半分の合計の画素値を有効画素数で除算することにより、左側隣接ブロックの右半分の画素値の平均を得る処理と、この平均からCoWH行列に基づいて水平予測モードの予測測定データYを得る処理とを実行する。
Figure 0007620308000037
In this way, for the horizontal prediction mode, the intra prediction unit 121 executes a process of obtaining a total pixel value of the right half of the left adjacent block in the pixel domain by subtracting the measurement value y2 obtained for the left adjacent block from the measurement value y1 obtained for the left adjacent block, a process of obtaining an average of the pixel values of the right half of the left adjacent block by dividing the total pixel value of the right half by the number of valid pixels, and a process of obtaining predicted measurement data Yh for the horizontal prediction mode from this average based on the CoWH matrix.

さらに、予測データ生成部1212は、予測測定データY及び予測測定データYの平均を平均予測モードの予測測定データYavgとして求める。 Furthermore, the predicted data generating unit 1212 calculates the average of the predicted measurement data Yv and the predicted measurement data Yh as predicted measurement data Yavg in the average prediction mode.

このようなイントラ予測の方法は、次のように表現できる。 This type of intra prediction method can be expressed as follows:

垂直予測モード: Vertical prediction mode:

Figure 0007620308000038
水平予測モード:
Figure 0007620308000038
Horizontal prediction mode:

Figure 0007620308000039
平均予測モード:
Figure 0007620308000039
Average prediction mode:

Figure 0007620308000040
Figure 0007620308000040

選択部1213は、最終的なイントラ予測モードの予測測定データYを選択するために、次のようにSADを用いて、予測候補とYとの間の最小差 In order to select the final intra-prediction mode prediction measurement data Y p , the selection unit 1213 uses the SAD as follows to find the minimum difference between the prediction candidate and Y:

Figure 0007620308000041
を検索し、次のように予測測定データYを選択する。
Figure 0007620308000041
and select the predicted measurement data Y p as follows:

Figure 0007620308000042
Figure 0007620308000042

但し、選択部1213は、予測候補が選択されない場合、予測測定データYをゼロに割り当てる。 However, if no predicted candidate is selected, the selection unit 1213 assigns zero to the predicted measurement data Y p .

そして、残差データ生成部122は、次のようにして残差データYを算出する。 Then, the residual data generating unit 122 calculates the residual data Yr as follows.

Figure 0007620308000043
Figure 0007620308000043

量子化部123は、次のようにスカラー量子化により残差データYを量子化して量子化データYを出力する。 The quantization unit 123 quantizes the residual data Yr by scalar quantization as follows, and outputs quantized data Yq .

Figure 0007620308000044
Figure 0007620308000044

但し、Bはビット深度パラメータであって、例えば4ビットである。 where Bp is a bit depth parameter, for example 4 bits.

なお、逆量子化部126は次の計算を行う。 The inverse quantization unit 126 performs the following calculations:

Figure 0007620308000045
Figure 0007620308000045

これらの処理の中で量子化は非可逆であるが、イントラ予測及びエントロピー符号化は可逆である。 Of these processes, quantization is lossy, while intra prediction and entropy coding are lossless.

(3)測定復号装置
次に、本実施形態に係る測定復号装置200について説明する。図10は、本実施形態に係る測定復号装置200の構成を示す図である。
(3) Measurement Decoding Apparatus Next, a description will be given of the measurement decoding apparatus 200 according to this embodiment. Fig. 10 is a diagram showing the configuration of the measurement decoding apparatus 200 according to this embodiment.

図10に示すように、測定復号装置200は、受信部210と、復号装置220と、復元部230とを有する。 As shown in FIG. 10, the measurement decoding device 200 has a receiving unit 210, a decoding device 220, and a restoration unit 230.

受信部210は、測定符号化装置100から伝送路を介して符号化データを受信し、受信した符号化データを復号装置220に出力する。符号化データは、測定符号化装置100が選択した予測モードを示すモード情報を含む。受信部210は、モード情報も復号装置220に出力する。 The receiving unit 210 receives encoded data from the measurement encoding device 100 via a transmission path, and outputs the received encoded data to the decoding device 220. The encoded data includes mode information indicating the prediction mode selected by the measurement encoding device 100. The receiving unit 210 also outputs the mode information to the decoding device 220.

復号装置220は、イントラ予測部221と、ハフマン復号部222と、逆量子化部223と、合成部224とを有する。イントラ予測部221は、参照データ生成部2211と、予測データ生成部2212とを有する。 The decoding device 220 has an intra prediction unit 221, a Huffman decoding unit 222, an inverse quantization unit 223, and a synthesis unit 224. The intra prediction unit 221 has a reference data generation unit 2211 and a prediction data generation unit 2212.

参照データ生成部2211は、測定符号化装置100の参照データ生成部1211と同様に構成され、予測データ生成部2212は、測定符号化装置100の参照データ生成部1211と同様に構成される。但し、予測データ生成部2212は、測定符号化装置100から伝送されるモード情報が示す予測モードについてのみ予測測定データYを生成し、生成した予測測定データYを合成部224に出力する。 The reference data generating unit 2211 is configured similarly to the reference data generating unit 1211 of the measurement coding device 100, and the predicted data generating unit 2212 is configured similarly to the reference data generating unit 1211 of the measurement coding device 100. However, the predicted data generating unit 2212 generates predicted measurement data Yp only for the prediction mode indicated by the mode information transmitted from the measurement coding device 100, and outputs the generated predicted measurement data Yp to the synthesis unit 224.

ハフマン復号部222は、受信部210が出力する符号化データに対してハフマン復号処理を行うことにより量子化データYを復元し、復元した量子化データYを逆量子化部223に出力する。 The Huffman decoding unit 222 performs Huffman decoding processing on the coded data output by the receiving unit 210 to restore the quantized data Yq , and outputs the restored quantized data Yq to the inverse quantization unit 223 .

逆量子化部223は、復元量子化データYに対して逆量子化処理を行うことにより残差データYを復元し、復元残差データYdeqを合成部224に出力する。 The inverse quantization unit 223 performs an inverse quantization process on the restored quantized data Yq to restore the residual data Yr , and outputs the restored residual data Ydeq to the synthesis unit 224.

合成部224は、復元残差データYdeqと予測測定データYとを合成することにより測定データYを復元し、復元測定データを復元部230に出力する。 The combining section 224 combines the reconstructed residual data Y deq and the predicted measurement data Y p to reconstruct the measurement data Y, and outputs the reconstructed measurement data to the reconstruction section 230 .

復元部230は、測定データYから元のn画素分の画素値X(画像ブロック)を復元アルゴリズムにより復元して出力する。CS理論は、m次元の測定データは効率的な復元アルゴリズムを介して元の信号の測定を復元するのに十分であると主張する。例えば、復元部230は、lアルゴリズム及びIFWHTを用いて元のn画素分の画素値X(画像ブロック)を復元する。 The restoration unit 230 restores pixel values X (image block) of the original n pixels from the measurement data Y using a restoration algorithm and outputs the restored pixel values. The CS theory asserts that m-dimensional measurement data is sufficient to restore the measurement of the original signal through an efficient restoration algorithm. For example, the restoration unit 230 restores pixel values X (image block) of the original n pixels using the l 1 algorithm and IFWHT.

(4)作用・効果
本実施形態によれば、ウォルシュ・アダマール変換(WHT:Walsh-Hadamard transform)に基づく最適化されたバイナリ構造測定行列(SRM:structural measurement matrix)を含む新たな高解像度BCIのための軽量な符号化フレームワークを実現できる。また、測定ドメインにおいて、CoWH行列の特徴を活用したイントラ予測を行うことにより、空間冗長性を削減できる。よって、効率的に画像を圧縮して保存及び伝送できる。
(4) Actions and Effects According to the present embodiment, a lightweight coding framework for a new high-resolution BCI can be realized, including an optimized binary structural measurement matrix (SRM) based on the Walsh-Hadamard transform (WHT). In addition, spatial redundancy can be reduced by performing intra prediction in the measurement domain using the features of the CoWH matrix. Therefore, images can be efficiently compressed for storage and transmission.

以下において、メモリ空間に効率的に格納し、符号化された測定値を伝送するためのシミュレーション結果について説明する。定量的メトリックは、PSNR(peak-to-noise-ratio)、SSIM(structural similarity index measure)、bpp(bits-per-pixel)である。 In the following, we present simulation results for efficiently storing and transmitting the encoded measurements in memory space. The quantitative metrics are peak-to-noise-ratio (PSNR), structural similarity index measure (SSIM), and bits-per-pixel (bpp).

「A. Mercat, M. Viitanen, and J. Vanne, “UVG dataset: 50/120fps 4K sequences for video codec analysis and development,” in Proc. ACM Multimedia Syst. Conf., Istanbul, Turkey, June 2020」で規定されるBeauty、ReadySetGo、Bosphorus、HoneyBeeで構成される色空間で4Kデータセットを使用する。ここで、n=24883200(3840×2160×3)、SR∈{4/4、1/8、1/16、1/32、1/64}およびB=16である。 We use a 4K dataset in the color space Beauty, ReadySetGo, Bosphorus, and HoneyBee defined in "A. Mercat, M. Viitanen, and J. Vanne, "UVG dataset: 50/120fps 4K sequences for video codec analysis and development," in Proc. ACM Multimedia Syst. Conf., Istanbul, Turkey, June 2020". Here, n = 24883200 (3840 x 2160 x 3), SR ∈ {4/4, 1/8, 1/16, 1/32, 1/64}, and B = 16.

下記の表1は、符号化無しのPSNR(dB)、SSIM、bppに関する最小プロセスBCI測定の比較を示す。表1の最小プロセスBCI測定の比較によると、CoWH行列は、SRが減少するたびにPSNRが平均5~8%、SSIMが0.2~0.5の品質劣化特性を提供することが分かる。 Table 1 below shows a comparison of minimum process BCI measurements for PSNR (dB), SSIM, and bpp without coding. The comparison of minimum process BCI measurements in Table 1 shows that the CoWH matrix provides an average degradation of PSNR of 5-8% and SSIM of 0.2-0.5 for each reduction in SR.

Figure 0007620308000046
Figure 0007620308000046

さらに、SRが1/16に等しい場合、CoWH行列は、1/32および1/64と比較して、アンダーサンプリングアーティファクトが少なく、良好な結果の下限を提供している。以下において、SRを1/16に固定して、符号化性能を評価し、最先端の研究と比較する。 Furthermore, when SR is equal to 1/16, the CoWH matrix provides a better lower bound with fewer undersampling artifacts compared to 1/32 and 1/64. In the following, we fix SR to 1/16 to evaluate the coding performance and compare it with state-of-the-art work.

さらに、各投影パターン間の関係を高めることにより、より高い視覚品質が得られるという仮説を証明する。但し、その結果、エッジの詳細が失われる。 Furthermore, we prove the hypothesis that by increasing the relationship between each projected pattern, higher visual quality can be obtained, although this results in a loss of edge detail.

さらに、本実施形態に係る測定符号化装置100によるイントラ予測(IPMC:Intra Prediction-based Measurement Coding)を、最小限のプロセスBCI測定を空間的に符号化する最先端の研究と比較する。これらの比較では、最先端のコードを選択した。ただし、符号化性能の比較を公平にするために、量子化方法及びパラメータを同じに変更した。SQを使用し、ベースラインとして Furthermore, intra prediction-based measurement coding (IPMC) by the measurement coding device 100 according to the present embodiment is compared with state-of-the-art work on spatially coding minimal process BCI measurements. For these comparisons, state-of-the-art codes were selected. However, to make the comparison of coding performance fair, the quantization method and parameters were changed to be the same. SQ was used and used as a baseline.

Figure 0007620308000047
を用いて測定値をサンプリングした。
Figure 0007620308000047
The measurements were sampled using

Figure 0007620308000048
Figure 0007620308000048

表2のシミュレーション結果のように、IPMCは全体としてPSNRが19.96%dB、SSIMが20.25%、bppが10.34%のSQを達成した。 As shown in the simulation results in Table 2, IPMC achieved an overall PSNR of 19.96% dB, SSIM of 20.25%, and SQ of 10.34% bpp.

DPCMと比較すると、PSNRが14.50%、SSIMが9.19%、bppが8.77%を達成し、あらゆる面でDPCMを上回った。 Compared to DPCM, it achieved PSNR of 14.50%, SSIM of 9.19%, and bpp of 8.77%, outperforming DPCM in all respects.

SDPCなどの同様の符号化と比較すると、PSNRが14.37%、SSIMが9.19%、bppが7.19%であった。 Compared to similar coding such as SDPC, the PSNR was 14.37%, SSIM was 9.19%, and bpp was 7.19%.

さらに、サンプリングおよび符号化のより進歩したModified SRMと比較すると、PSNRが11.73%、SSIMが13.09%、bppが6.74%と本実施形態が上回った。したがって、Modified SRMは、隣接するブロックから情報を取得するためにバイナリSRMを変更し、H.264として最終的にイントラ予測候補を生成するため、あまり効率的ではない。 Moreover, compared to Modified SRM, which has more advanced sampling and coding, the present embodiment outperforms it by 11.73% in PSNR, 13.09% in SSIM, and 6.74% in bpp. Therefore, Modified SRM is not very efficient because it modifies binary SRM to obtain information from neighboring blocks and finally generates intra prediction candidates as H.264.

よって、本実施形態に係るIPMCは、最先端の研究と比較して、PSNRが15.06%、SSIMが18.74%、bppが3.7%という点で、全体的に優れた符号化性能を示した。 Thus, the IPMC of this embodiment exhibits an overall superior coding performance compared to state-of-the-art research, with PSNR of 15.06%, SSIM of 18.74%, and bpp of 3.7%.

図11は、HoneyBeeデータセットを使用して400%ズームした詳細の例を示す図である。図11において、(a)はSQ(ベースライン)、(b)はDPCM、(c)はSDCP、(d)はModified SRM、(e)は本実施形態である。図11に示すように、HoneyBeeデータセットを使用してトリミングされた結果によると、SRが1/16の場合、本実施形態は最先端の研究と比較してより豊かな視覚品質を提供した。 Figure 11 shows an example of 400% zoomed detail using the HoneyBee dataset. In Figure 11, (a) is SQ (baseline), (b) is DPCM, (c) is SDCP, (d) is Modified SRM, and (e) is the present embodiment. As shown in Figure 11, the cropped results using the HoneyBee dataset show that when SR is 1/16, the present embodiment provides richer visual quality compared to state-of-the-art research.

よって、表2の全体的な性能によると、本実施形態は、最先端の研究に対して、すべての面でトレードオフの性能パフォーマンスをもたらした。 Thus, according to the overall performance in Table 2, this embodiment provides all-around trade-off performance relative to state-of-the-art research.

さらに、FPGAにIPMCアルゴリズムを実装した。ここで、解像度は3820×2140、合計ロジック使用率は3,421、最大動作周波数は102.65MHzである。このアーキテクチャは、28.32mWの電力を消費した。これにより、表3に要約されているように、ソフトウェア実装よりも100倍高速なリアルタイムエンコーディングの可能性がもたらされた。 Furthermore, we implemented the IPMC algorithm in an FPGA, where the resolution is 3820x2140, the total logic utilization is 3,421, and the maximum operating frequency is 102.65MHz. This architecture consumed 28.32mW of power. This resulted in the possibility of real-time encoding 100 times faster than the software implementation, as summarized in Table 3.

Figure 0007620308000049
Figure 0007620308000049

(5)その他の実施形態
上述の実施形態に係る各処理をコンピュータに実行させるプログラムが提供されてもよい。プログラムは、コンピュータ読取り可能媒体に記録されていてもよい。コンピュータ読取り可能媒体を用いれば、コンピュータにプログラムをインストールすることが可能である。ここで、プログラムが記録されたコンピュータ読取り可能媒体は、非一過性の記録媒体であってもよい。非一過性の記録媒体は、特に限定されるものではないが、例えば、CD-ROMやDVD-ROM等の記録媒体であってもよい。
(5) Other embodiments A program may be provided that causes a computer to execute each process according to the above-described embodiments. The program may be recorded in a computer-readable medium. Using the computer-readable medium, it is possible to install the program in a computer. Here, the computer-readable medium on which the program is recorded may be a non-transient recording medium. The non-transient recording medium is not particularly limited, and may be, for example, a recording medium such as a CD-ROM or a DVD-ROM.

測定符号化装置100(符号化装置120)が行う各処理を実行する回路を集積化し、測定符号化装置100(符号化装置120)を半導体集積回路(チップセット、SoC)により構成してもよい。 The circuits that execute each process performed by the measurement coding device 100 (coding device 120) may be integrated, and the measurement coding device 100 (coding device 120) may be configured as a semiconductor integrated circuit (chip set, SoC).

以上、図面を参照して実施形態について詳しく説明したが、具体的な構成は上述のものに限られることはなく、要旨を逸脱しない範囲内において様々な設計変更等をすることが可能である。 The above describes the embodiment in detail with reference to the drawings, but the specific configuration is not limited to the above, and various design changes can be made without departing from the spirit of the invention.

1 :測定伝送システム
100 :測定符号化装置
110 :イメージング装置
111 :イメージセンサ部
111a :画素アレイ
111b :行選択部
111c :列選択部
112 :圧縮センシング部
112a :行列演算トリガ部
112b :行列演算部
113 :A/D変換部
120 :符号化装置
121 :イントラ予測部
122 :残差データ生成部
123 :量子化部
124 :ハフマン符号化部
125 :ハフマン復号部
126 :逆量子化部
127 :合成部
130 :送信部
141 :入力バッファ
142 :出力バッファ
200 :測定復号装置
210 :受信部
220 :復号装置
221 :イントラ予測部
222 :ハフマン復号部
223 :逆量子化部
224 :合成部
230 :復元部
1211 :参照データ生成部
1211a :パッケージスプリッタ
1211b :減算器
1211c :減算器
1211d :レジスタ
1211e :レジスタ
1212 :予測データ生成部
1213 :選択部
2211 :参照データ生成部
2212 :予測データ生成部
1: Measurement transmission system 100: Measurement encoding device 110: Imaging device 111: Image sensor unit 111a: Pixel array 111b: Row selection unit 111c: Column selection unit 112: Compressive sensing unit 112a: Matrix operation trigger unit 112b: Matrix operation unit 113: A/D conversion unit 120: Encoding device 121: Intra prediction unit 122: Residual data generation unit 123: Quantization unit 124: Huffman encoding unit 125: Huffman decoding unit 126: Inverse quantization unit 127: Synthesis unit 130: Transmission unit 141: Input buffer 142: Output buffer 200: Measurement decoding device 210: Reception unit 220: Decoding device 221: Intra prediction unit 222: Huffman decoding unit 223: Inverse quantization unit 224: Synthesis unit 230 : Restoration unit 1211 : Reference data generation unit 1211a : Package splitter 1211b : Subtractor 1211c : Subtractor 1211d : Register 1211e : Register 1212 : Prediction data generation unit 1213 : Selection unit 2211 : Reference data generation unit 2212 : Prediction data generation unit

Claims (8)

画像ブロック単位で画像出力を行うイメージセンサ部と、
前記画像ブロックを構成するn画素の画素値にm行n列(m<n)の測定行列を適用してm個の測定値を出力する圧縮センシング処理を行う圧縮センシング部と、
前記m個の測定値に対してアナログ/デジタル変換処理を行うことにより測定データを出力するアナログ/デジタル変換部と、を備え、
前記圧縮センシング部は、NoH(Naturally ordered Hadamard)行列の各行をシーケンシー順に並べたSoWH(Sequency ordered Walsh-Hadamard)行列に基づくCoWH(Continuously ordered Walsh-Hadamard)行列を前記測定行列として用いて、前記圧縮センシング処理を行い、
前記CoWH行列の各行は、前記画像ブロックに投影したときの投影パターンが互いに異なり、
前記CoWH行列は、前記CoWH行列における上側の行から下側の行に向かうにつれて、前記投影パターンにおいて同値の要素が連続する数が少なくなるように構成されていることを特徴とするイメージング装置。
an image sensor unit that outputs images in units of image blocks;
a compressed sensing unit that performs a compressed sensing process by applying a measurement matrix with m rows and n columns (m<n) to pixel values of n pixels that constitute the image block to output m measurement values;
an analog/digital conversion unit that outputs measurement data by performing analog/digital conversion processing on the m measurement values,
The compressed sensing unit performs the compressed sensing process by using, as the measurement matrix, a CoWH (Continuously ordered Walsh-Hadamard) matrix based on a SoWH (Sequency ordered Walsh-Hadamard) matrix in which each row of a NoH (Naturally ordered Hadamard) matrix is arranged in sequential order;
Each row of the CoWH matrix has a different projection pattern when projected onto the image block,
An imaging apparatus, comprising: a CoWH matrix configured such that the number of consecutive elements with the same value in the projection pattern decreases from upper rows to lower rows in the CoWH matrix.
前記CoWH行列は、
前記画像ブロックの全画素値を取得する第1投影パターンを構成する行と、
前記画像ブロックの上半分の画素値を取得する第2投影パターンを構成する行と、
前記画像ブロックの左半分の画素値を取得する第3投影パターンを構成する行と、を有することを特徴とする請求項1に記載のイメージング装置。
The CoWH matrix is
a row constituting a first projection pattern for acquiring all pixel values of the image block;
rows constituting a second projection pattern for acquiring pixel values of an upper half of the image block;
and a third projection pattern of rows that capture pixel values in a left half of the image block.
前記CoWH行列における最も上側の行は、前記第1投影パターンを構成し、
前記CoWH行列における上から2番目及び3番目の行は、前記第2投影パターン及び前記第3投影パターンを構成することを特徴とする請求項2に記載のイメージング装置。
the topmost row in the CoWH matrix constitutes the first projection pattern;
The imaging apparatus of claim 2 , wherein the second and third rows from the top of the CoWH matrix constitute the second and third projection patterns.
請求項2又は3に記載のイメージング装置と、
前記画像ブロックの上側に隣接する上側隣接ブロックを用いた垂直予測モードと前記画像ブロックの左側に隣接する左側隣接ブロックを用いた水平予測モードとを含む複数のイントラ予測モードのいずれか1つを用いて、前記画像ブロックの前記測定データを予測した予測測定データを出力するイントラ予測部と、
前記画像ブロックの前記測定データと前記イントラ予測部が出力する前記予測測定データとの差分を表す残差データに対して量子化処理を行う量子化部と、を備えることを特徴とする測定符号化装置。
An imaging device according to claim 2 or 3;
an intra prediction unit that outputs predicted measurement data obtained by predicting the measurement data of the image block using one of a plurality of intra prediction modes including a vertical prediction mode using an upper adjacent block adjacent to the upper side of the image block and a horizontal prediction mode using a left adjacent block adjacent to the left side of the image block;
a quantization unit that performs a quantization process on residual data representing a difference between the measurement data of the image block and the predicted measurement data output by the intra prediction unit.
前記イントラ予測部は、前記垂直予測モードについて、
前記上側隣接ブロックに対して前記第1投影パターンを適用して得られた測定値から、前記上側隣接ブロックに対して前記第2投影パターンを適用して得られた測定値を減算することにより、画素ドメインにおける前記上側隣接ブロックの下半分の合計の画素値を得る処理と、
前記下半分の合計の画素値を有効画素数で除算することにより、前記上側隣接ブロックの下半分の画素値の平均を得る処理と、
前記CoWH行列に基づいて、前記平均から前記垂直予測モードの予測測定データを得る処理と、を実行することを特徴とする請求項4に記載の測定符号化装置。
The intra prediction unit, with respect to the vertical prediction mode,
obtaining a total pixel value for a lower half of the upper adjacent block in the pixel domain by subtracting measurements obtained by applying the second projection pattern to the upper adjacent block from measurements obtained by applying the first projection pattern to the upper adjacent block;
obtaining an average of the pixel values of the lower half of the upper adjacent block by dividing the total pixel value of the lower half by the number of valid pixels;
and obtaining predicted measurement data for the vertical prediction mode from the average based on the CoWH matrix.
前記イントラ予測部は、前記水平予測モードについて、
前記左側隣接ブロックに対して前記第1投影パターンを適用して得られた測定値から、前記左側隣接ブロックに対して前記第3投影パターンを適用して得られた測定値を減算することにより、画素ドメインにおける前記左側隣接ブロックの右半分の合計の画素値を得る処理と、
前記右半分の合計の画素値を有効画素数で除算することにより、前記左側隣接ブロックの右半分の画素値の平均を得る処理と、
前記CoWH行列に基づいて、前記平均から前記水平予測モードの予測測定データを得る処理と、を実行することを特徴とする請求項4又は5に記載の測定符号化装置。
The intra prediction unit, with respect to the horizontal prediction mode,
obtaining a sum of pixel values for a right half of the left adjacent block in the pixel domain by subtracting measurements obtained by applying the third projection pattern to the left adjacent block from measurements obtained by applying the first projection pattern to the left adjacent block;
obtaining an average of the pixel values of the right half of the left adjacent block by dividing the sum of the pixel values of the right half by the number of valid pixels;
6. The measurement coding device according to claim 4, further comprising a process of obtaining predicted measurement data for the horizontal prediction mode from the average based on the CoWH matrix.
前記複数のイントラ予測モードは、前記垂直予測モードの予測測定データと前記水平予測モードの予測測定データとの平均を予測測定データとして算出する平均予測モードをさらに含み、
前記イントラ予測部は、前記垂直予測モードの予測測定データと、前記水平予測モードの予測測定データと、前記平均予測モードの予測測定データとのそれぞれについて、前記画像ブロックの測定データとの類似度を算出することにより、前記類似度が最も高い予測測定データを選択する処理を実行することを特徴とする請求項4乃至6のいずれか1項に記載の測定符号化装置。
The plurality of intra prediction modes further include an average prediction mode that calculates an average of prediction measurement data of the vertical prediction mode and prediction measurement data of the horizontal prediction mode as prediction measurement data;
The measurement encoding device described in any one of claims 4 to 6, characterized in that the intra prediction unit calculates a similarity between the measurement data of the image block and each of the prediction measurement data of the vertical prediction mode, the prediction measurement data of the horizontal prediction mode, and the prediction measurement data of the average prediction mode, and selects the prediction measurement data with the highest similarity.
前記量子化部により量子化された残差データを符号化する符号化部と、
前記符号化部により符号化された残差データを復号側に送信する送信部と、をさらに備え、
前記送信部は、前記イントラ予測部が選択した予測測定データの予測モードを示すモード情報をさらに送信することを特徴とする請求項7に記載の測定符号化装置。
an encoding unit that encodes the residual data quantized by the quantization unit;
A transmitter that transmits the residual data encoded by the encoding unit to a decoding side,
The measurement encoding device of claim 7 , wherein the transmission unit further transmits mode information indicating a prediction mode of the predicted measurement data selected by the intra prediction unit.
JP2021008179A 2021-01-21 2021-01-21 Imaging device and measurement coding device Active JP7620308B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2021008179A JP7620308B2 (en) 2021-01-21 2021-01-21 Imaging device and measurement coding device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2021008179A JP7620308B2 (en) 2021-01-21 2021-01-21 Imaging device and measurement coding device

Publications (2)

Publication Number Publication Date
JP2022112364A JP2022112364A (en) 2022-08-02
JP7620308B2 true JP7620308B2 (en) 2025-01-23

Family

ID=82655994

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021008179A Active JP7620308B2 (en) 2021-01-21 2021-01-21 Imaging device and measurement coding device

Country Status (1)

Country Link
JP (1) JP7620308B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2024147300A (en) 2023-04-03 2024-10-16 浜松ホトニクス株式会社 Solid-state imaging device

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006115459A (en) 2004-10-11 2006-04-27 Ind Technol Res Inst System and method for increasing SVC compression ratio
WO2008120577A1 (en) 2007-03-29 2008-10-09 Kabushiki Kaisha Toshiba Image coding and decoding method, and apparatus
JP2011193431A (en) 2010-02-22 2011-09-29 Nippon Telegr & Teleph Corp <Ntt> Signal processing system and signal processing method
JP2015162684A (en) 2014-02-25 2015-09-07 日本電信電話株式会社 signal processing system and signal processing method

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006115459A (en) 2004-10-11 2006-04-27 Ind Technol Res Inst System and method for increasing SVC compression ratio
WO2008120577A1 (en) 2007-03-29 2008-10-09 Kabushiki Kaisha Toshiba Image coding and decoding method, and apparatus
JP2011193431A (en) 2010-02-22 2011-09-29 Nippon Telegr & Teleph Corp <Ntt> Signal processing system and signal processing method
JP2015162684A (en) 2014-02-25 2015-09-07 日本電信電話株式会社 signal processing system and signal processing method

Also Published As

Publication number Publication date
JP2022112364A (en) 2022-08-02

Similar Documents

Publication Publication Date Title
Kang et al. Distributed compressive video sensing
JP5566529B2 (en) How to code a video using a dictionary
Dinh et al. Measurement coding for compressive imaging using a structural measuremnet matrix
Chen et al. Dynamic measurement rate allocation for distributed compressive video sensing
CN114145016B (en) Matrix Weighted Intra Prediction of Video Signals
JP2006074733A (en) System and method for coding image employing combination of hybrid directional prediction and wavelet lifting
JP7431752B2 (en) Video encoding, video decoding method, device, computer device and computer program
Zhang et al. Spatially directional predictive coding for block-based compressive sensing of natural images
Tomar et al. Lossless image compression using differential pulse code modulation and its application
JPWO2017183448A1 (en) Data processing apparatus, data processing method, and program
CN108235020A (en) A kind of spiral block-by-block measured value Forecasting Methodology perceived towards quantization splits&#39; positions
Unde et al. Rate–distortion analysis of structured sensing matrices for block compressive sensing of images
JP7620308B2 (en) Imaging device and measurement coding device
RU2683614C2 (en) Encoder, decoder and method of operation using interpolation
CN106688235B (en) Signal encoding method and decoding method for non-causal prediction
Unde et al. Adaptive compressive video coding for embedded camera sensors: compressed domain motion and measurements estimation
Zhao et al. Compressive-sensed image coding via stripe-based DPCM
CN113055678B (en) A Measurement Domain Compressed Sensing Coding Algorithm Based on Adjacent Pixel Correlation
KR100846870B1 (en) Apparatus and method of multi-stage, multi-dimensional transform based on multiple unit blocks
JP2009296277A (en) Image coder, image decoder, image coding method, image decoding method, and program
Peetakul et al. Intra prediction-based measurement coding algorithm for block-based compressive sensing images
CN109819258A (en) A kind of splits&#39; positions perceived direction predictive coding method based on spiral scan
CN106954070A (en) A sliding pixel block integer DCT core matrix transformation motion compensator and method
WO2009043869A1 (en) Methods of encoding and reconstructing image data and devices implementing said methods
JP6864557B2 (en) Encoding device, decoding device, and program

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210226

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20231122

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20241120

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20241217

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20241227

R150 Certificate of patent or registration of utility model

Ref document number: 7620308

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150