橙色の日々を。

わたくし橙乃が気になったことをクリップするブログ。

【Deep Learning】SRCNNの論文をツールに通して雑に訳す【関連研究】

横文字にしかならないときは大体そういう手法なんだよね。

 

海外の方の名前つけるのやめて!長い!

 

SRCNN・訳・関連研究編

 

 

こんにちは、橙乃巻です。

 

論文読んでますよ~楽しいな~(白目)

 

「翻訳」内容に関しては一切の責任を問いません。

いままで入れてなかったな?

 

本文を右手に

真水を左手に

夜は眠れなくなるからね。

 

参考程度にどうぞ!

 

本文は以下より。

Image Super-Resolution Using Deep Convolutional Networks.

https://arxiv.org/pdf/1501.00092.pdf

 

<関連研究>

画像超解像

  1. イメージプリオーラによれば、単一画像超解像アルゴリズムは、予測モデル、エッジベースの方法、画像統計方法、およびパッチベース(または例ベース)の4種類に分類することができる。※イメージプリオーラってなんだよ。。。
  2. これらの方法は、Yangらの研究[46]で完全に調査され、評価されている。
  3. その中で、例に基づく方法[16]、[25]、[41]、[47]は、最先端のパフォーマンスを実現する。
  4. 内部的な例に基づく方法は、自己相似性を利用し、入力画像から模範的なパッチを生成する。
  5. これはGlasnerの研究[16]で最初に提案され、いくつかの改良された変種[13]、[45]が実装を加速するために提案されている。
  6. 外部の例に基づく方法[2]、[4]、[6]、[15]、[37]、[41]、[48]、[49]、[50]、[51] (外部のデータセットからの高解像度のパッチ)であるこれらの研究は、低/高解像度のパッチを関連付けるコンパクトな辞書または多様な空間をどのように学習するか、そのような空間で表現スキームをどのように実行できるかによって異なる。
  7. Freemanらの先駆的研究では、 [14]、辞書は低/高解像度パッチ対として直接提示され、入力パッチの最近接(NN)は低分解能空間で見つけられ、対応する高解像度パッチが再構成に使用される。
  8. Changら[4]は、NN戦略の代替として多様な埋め込み技術を導入する。
  9. Yangらの研究[49]、[50]では、上記のNN対応は、より洗練された疎な符号化式に進んでいる。
  10. カーネル回帰[25]、単純関数[47]、ランダムな森林[37]、アンカーされた近傍回帰[41]、[42]などの他のマッピング関数は、マッピング精度と速度をさらに改善するために提案されている。
  11. スパースコーディングに基づく方法とそのいくつかの改良[41]、[42]、[48]は、現在の最先端のSR方法の1つである。
  12. これらの方法では、パッチが最適化の焦点である。
  13. パッチの抽出と集約のステップは、前処理/後処理とみなされ、別々に処理される。
  14. SRアルゴリズムの大部分は、グレースケールまたは単一チャネル画像の超解像に焦点を当てている[2]、[4]、[41]、[48]、[49]、[50]、[51]。
  15. カラー画像の場合、前述の方法はまず問題を異なる色空間(YCbCrまたはYUV)に変換し、SRは輝度チャネルにのみ適用される。
  16. また、すべてのチャンネルを同時に超解像しようとする試みもある。
  17. 例えば、Kim and Kwon [25]およびDaiらは、 [7]モデルを各RGBチャネルに適用し、それらを結合して最終結果を生成する。
  18. しかし、いずれも、異なるチャネルのSR性能と、3つのチャネルすべてを回復する必要性を分析していない

CNN

  1. 畳み込みニューラルネットワーク(CNN)は過去数十年の歴史を持ち[27]、深いCNNは最近、画像分類の成功のために爆発的な人気を示している[18]、[26]。
  2. また、物体検出[34]、[40]、[52]、顔認識[39]、歩行者検出[35]などの他のコンピュータ視覚野にも有効に適用されている。
  3. この進展には、
  4. (i)最新の強力なGPU [26]の効率的な訓練の実施
  5. (ii)収束をはるかに速くしながらも良い結果をもたらす整流リニアユニット(ReLU)[33]の提案 ※ReLUはReLUでええやん?
  6. (3)大規模なモデルを訓練するための豊富なデータ(ImageNet [9]のような)への容易なアクセス
  7. が寄与している。
  8. 我々の方法はまた、これらの進歩から利益を得る。

画像超解像のための深層学習 

  1. 画像修復のための深い学習技術の使用に関するいくつかの研究が行われてきた。
  2. すべての層が(畳み込みとは対照的に)完全に接続された多層パーセプトロンMLP)は、自然画像ノイズ除去[3]およびぼけ除去後ノイズ除去[36]に適用される。
  3. 私たちの研究と密接に関連して、畳み込みニューラルネットワークは、自然画像のノイズ除去[22]と雑音の多いパターン(埃/雨)の除去[12]に適用されます。
  4. これらの復元の問題は、多かれ少なかれ、ノイズ除去に起因している。
  5. [5]は、内部標本化手法[16]の考え方で、自動エンコーダネットワークを超解像パイプラインに埋め込むことを提案している[5]。※AutoEncoder
  6. ディープモデルは、カスケードの各レイヤーが自己相似性検索プロセスとオートエンコーダの独立した最適化を必要とするため、エンドツーエンドのソリューションになるよう特別に設計されていません。※カスケード=連なった
  7. これとは対照的に、提案されたSRCNNはエンドツーエンドマッピングを最適化する。
  8. さらに、SRCNNは高速である。
  9. それは定量的に優れた方法であるだけでなく、実用的な方法でもある。※エンドツーエンド:両者を結ぶ

 

高速で高速である( ー`дー´)キリッ

何かを間違えた。。。

 

次回、「超解像のためのCNN」編。