特徴量
SIFT
Scale Invariant Feature Transformの略。2004年発表。Difference of Gaussian (DoG)の極値を探すことでエッジ点を検出。回転、拡大縮小、限定アフィン変換に対して頑強だが、計算コストがかかる。
SURF
Speed Up Robust Featureの略。2008年発表。回転、拡大縮小に対して頑強だが、アフィン変換に対して弱い。SIFTと比べると高速。
KAZE
2012年発表。回転、拡大縮小、限定アフィン変換に対して頑強。
AKAZE
Accelerated-KAZE。2013年発表。回転、拡大縮小、限定アフィン変換に対して頑強。
BRIEF
Binary Robust Independent Elementary Featuresの略。 特徴点の記述に使われ、検出には使えない。
ORB
Oriented FAST and Rotated BRIEF の略。2013年発表。回転、拡大縮小、限定アフィン変換に対して頑強。
BRISK
Binary Robust Invariant Scalable Keypointsの略。2011年発表。
FAST
Features from Accelerated Segment Testの略。
Harris
コーナー検出。1988年
http://www.bmva.org/bmvc/1988/avc-88-023.pdf
参考
Harrisコーナー検出。
を適当な変位とする。画像上のある点がコーナーであるかを判定するために、点周りのみ0でない値を持つ窓関数を用いて
を使い、この値が大きい点でコーナーと判定する。
を変形すると
となる。ここで行列をと対角化したとすると
と変形できる。これは、という新しい直行軸を取ったときに、それぞれの方向にどれだけ変化するかを表しており、その変化係数がそれぞれの固有値である。。新しい直行軸は変化の主成分を表しているため、以下のことが言える。
具体例
コーナーの場合
窓関数領域において、方向と方向がそれぞれ独立に大きな微分、を取るとする。そうするとやは大きな値をとるがはある程度互いに独立になり0に近い値になるので、行列は対角行列に近くなり、固有ベクトルの方向も軸と軸に平行になる。
辺の場合
例えばx軸に平行な辺の場合、である。はと比べると大きくなり、は互いにキャンセルして0に近くなる。も小さい値であるが常に2乗で足していっているのでの項よりは大きくなると思うと、やはり行列は対角行列となり、第1固有値は軸方向、第2固有値は軸方向となる。
参考
SIFT
画像ピラミッド
画像ピラミッドとは、重み関数を定義し、この重みに基づいて圧縮した画像をピラミッドのように並べたものである。元の画像のサイズをとし、とすると、下から層目のピラミッドの画像はであり、
と表される。重み関数としてはガウシアンなどが使われる。またこのように画像サイズを圧縮することをOctaveと呼ぶ
参考
画像フィルターと微分の関係
画像の微分はフィルターをかけることと同値である。
1階微分
となるから、
となるから、これはというフィルターを適用したのと同等である。
2階微分
となるから、
となり、というフィルターを適用したのと同等である。2次元に拡張すれば、2階微分の和であるラプラシアンは
というフィルターとなる。
エッジとラプラシアンの関係
エッジ位置というのは2階微分が0でありかつ1階微分の絶対値が大きいところとして定義できる。したがってラプラシアンのフィルタをかけこの値の絶対値が小さいところをエッジ点とすればよい。
参考
https://www.cse.psu.edu/~rtc12/CSE486/lecture11.pdf
LoGとDoGの関係
まず、ガウシアンフィルターのラプラシアンは、ガウシアンのラプラシアンのフィルターになる。すなわち、をガウシアンフィルタ
とし、ピクセルの値をとすると、
となる。
証明
1次元の場合は、
となるので、
一方、異なる標準偏差のガウシアンを引き算すると、ガウシアンの2階微分の形に近くなる。 これが、LoG(Laplacian of Gaussian filter)をDoG(Difference of Gaussian filter)で近似するということである。すなわち、の異なるガウシアンフィルターを使って同じ画像サイズの画像をいくつか生成し、その差分をとることでラプラシアンフィルターの近似を得て、その絶対値が小さいところとしてエッジを検出する。また、その時に、1)同じのフィルターをかけた画像内での周辺8ピクセルおよび2)前後ののフィルターをかけた画像内での周辺および自分の位置9ピクセルを使って、異なるのフィルターをかけた画像においてもエッジとなっているかを確認したのち正式な特徴点として登録される。
参考
https://www.cse.psu.edu/~rtc12/CSE486/lecture11.pdf
Descriptorの計算
特徴点の周辺を領域に分割し、各領域ごとにごとに合計8方向の特徴ベクトルを用意する。したがってSIFTの1つの特徴点は合計128次元のベクトルである。