読者です 読者をやめる 読者になる 読者になる

橙色の日々を。

わたくし橙乃が気になったことをクリップするブログ。

【Deep Learning】SRCNNの論文をツールに通して雑に訳す【実験⑤:カラーチャンネルでの実験】

日付は適当。毎日やってる感を出したいだけ。

 

全然関係ないですけど、動物飼ってる人ってオーラでわかりますよね?

 

SRCNN・訳・実験編~カラーチャンネルでの実験~

 

 

こんにちは、橙乃巻です。

 

radikoプレミアム最強説を唱えてながら書いています。

 

「翻訳」内容に関しては一切の責任を問いません。

それでは聞いてください、とか書いちゃいそう。

 

毎日なんかしらラジオで聞いてますよ。

お金と時間があったらこの世の名曲を聴くだけの時間を過ごしたいものです。

 

参考程度にどうぞ!

 

本文は以下より。

Image Super-Resolution Using Deep Convolutional Networks.

https://arxiv.org/pdf/1501.00092.pdf

 

<実験>

カラーチャンネルでの実験

 

  1. 以前の実験で,私たちは従来のカラー画像の超解像の手法に従っている。
  2. 特に,私たちは初めにカラー画像をYCbCr空間に変換している。
  3. YCbCr … RGBで表現された値をもとに換算式で計算される数値で色を表す。
    → Y : 輝度,Cb : 青系統 Cr : 赤系統のそれぞれの色の色相と彩度を表す。
  4. SRアルゴリズムはYチャネルのみに適用され,Cb, Crチャネルはバイキュービックほかによってアップスケーリングされる。
  5. 処理の中で3つのチャネルすべてを共同で検討すると超解像度性能を改善できるかどうかを調べることは興味深いことである。
  6. 我々の方法は、学習メカニズムおよびネットワーク設計を変更することなく、より多くのチャネルを受け入れる柔軟性がある。
  7. 特に、入力チャンネルをc = 3に設定することにより、3つのチャンネルを同時に扱うことができる。
  8. 以下の実験では、カラー画像超解像のための異なる訓練戦略を探索し、その後、異なるチャネルでその性能を評価する。
  9. 実装詳細  
  10. トレーニングは91画像データセットに対して実行され、テストはSet5で実行される。
  11. ネットワーク設定は、c = 3、f1 = 9、f2 = 1、f3 = 5、n1 = 64、n2 = 32である。
  12. 異なるスケールでSRCNNの有効性が証明されているので、ここではアップスケーリングファクタ3のパフォーマンスのみを評価する。
  13. 比較
  14. 我々は、最先端のカラーSR法であるKKと比較する。
  15. 我々はまた、比較のために異なる学習戦略を試みる。
  16. •Yのみ:これは、ルミナンスチャネルでのみトレーニングされた単一チャネル
    (c = 1)ネットワークであるベースライン方式である。
  17. Cb、Crチャンネルは バイキュービック補間を用いてアップスケーリングされる。
  18. •YCbCr:YCbCr空間の3つのチャネルでトレーニングが実行される。
  19. •Y事前トレーニング:最初に、Yチャネルのパフォーマンスを保証するために、ネットワークを事前トレーニングするための損失としてYチャネルのMSEのみを
    使用する。
  20. 次に、すべてのチャネルのMSEを使用してパラメータを微調整する。   
  21. •CbCrプレトレーニング:Cb、CrチャンネルのMSEを損失として使用して、
    ネットワークの事前トレーニングを行い、すべてのチャンネルのパラメータを
    微調整する。
  22. ・RGB:RGB空間の3つのチャンネルでトレーニングが行われる。
  23. 結果を表5に示す。
  24. ここでは以下の観察がある。
  25. (i)YCbCrチャンネルを直接トレーニングすると、結果はバイキュービック補間の結果よりもさらに悪くなる。
  26. YとCb、Crチャンネルの本質的に異なる特性が原因で訓練は悪い極所解に陥る。
  27. (ii)YチャンネルまたはCb、Crチャンネルで事前にトレーニングすると、最終的に性能は向上するが、カラー画像ではまだ「Yのみ」よりも優れていない
    PSNRがRGB色空間で計算される表5の最後の列を参照)。
  28. これは、トレーニングが統合されたネットワークで実行されるとき、Cb、CrチャネルがYチャネルの性能を低下させる可能性があることを示唆している。
  29. (iii)我々は、Cb、Crチャネルが "Y pre-train"のPSNR値が "CbCr pre-train"よりも高いことを観察した。
  30. 理由は、Cb、CrチャネルとYチャネルの違いにある。
  31. 視覚的には、Cb、CrチャネルはYチャネルよりもぼやけているため、ダウンサンプリングプロセスの影響を受けにくい。
  32. 私たちがCb、Crチャンネルで事前にトレーニングするとき、わずかな数の
    フィルターが有効になる。
  33. その後微調整の間、トレーニングはすぐに悪い極所解に落ちる。
  34. 一方、Yチャンネルで事前にトレーニングすると、より多くのフィルターが有効になり、Cb、Crチャンネルのパフォーマンスが大幅に向上すする。
  35. 図13は、図5に示されたものとパターンが大きく異なる「Yプレトレーニング」を有する第1層フィルタのCb、Crチャネルを示す。
  36. (iv)RGBチャンネルでのトレーニングは、カラー画像で最良の結果を達成する。
  37. YCbCrチャネルとは異なり、RGBチャネルは互いの間で高い相互相関を示す。
  38. 提案されたSRCNNは、再構成のためのチャネル間のそのような自然な対応を利用することができる。
  39. したがって、このモデルは、Yチャンネルのみで「Yのみ」と同等の結果を
    達成し、双三次補間よりもCb、Crチャンネルで良好な結果を達成する。
  40. (v)KK [25]では、超解像度がRGBチャンネルごとに別々に適用される。
  41. その結果をYCbCr空間に変換すると、YチャンネルのPSNR値は "Yのみ"と類似
    しているが、Cb、CrチャンネルのPSNR値はバイキュービック補間よりも
    劣る。
  42. 結果は、アルゴリズムがYチャネルにバイアスされていることを示唆している。
  43. 全体として、RGBチャンネルで訓練された方法は、KKやシングルチャネル
    ネットワーク(「Yのみ」)よりも優れたパフォーマンスを実現する。
  44. 単一チャネルネットワークと比較した改善がそれほど重要ではない(すなわち、0.07dB)ことに留意する価値もある。
  45. これは、Cb、Crチャネルがパフォーマンスの改善にほとんど役に立たないことを示している。

 

おぉし!おしおしおぉおし!!

あと1章!!

 

次回、「結論」編。