Príznaky typu ,,farba''

Extrakcia farebných príznakov je jedna z najčastejšie používaných prístupov. Je to pomerne robustný prístup, nezávislý od rozmerov, natočenia obrazu. Niektoré reprezentatívne štúdie ohľadom vnímania farieb a možných reprezentácií sú uvedené v [11][40].
Pre reprezentáciu farebných príznakov sa najčastejšie používa histogram. Štatisticky znamená zjednotenú pravdepodobnosť farebných hladín všetkých farebných kanálov (zvyčajne R,G,B);
\begin{displaymath}
h_{R,G,B}[r,g,b] = N . Prob \{R=r, G=g, B=b\}
\end{displaymath} (3.1)

pričom R, G, B sú farebné zložky jednotlivých bodov, N je počet bodov obrazu. Farebný histogram sa potom vypočíta diskretizáciou farieb v rámci obrazu, a následným spočítaním bodov každej farby. Keďže počet farieb je konečný, je praktické pretransformovať histogram z funkcie troch premenných na funkciu jednej premennej. Ak máme k dispozícii RGB obraz, transformácia je daná vzťahom
\begin{displaymath}
m = r + N_{r}g + N_{r}N_{g}b
\end{displaymath} (3.2)

kde $N_{r}$,$N_{g}$ a $N_{b}$ sú počty zásobníkov farieb pre červenú, modrú a zelenú. Dostaneme
\begin{displaymath}
h[m] = N . Prob \{M = m \}
\end{displaymath} (3.3)

Existuje niekoľko metrík, pomocou ktorých sa dá určiť miera podobnosti histogramov: euklidovská, metrika L1 použitá v [70], metrika L2, ktorá berie do úvahy podobnosť veľmi podobných ale nie identických farieb[28]. Vzhľadom ku tomu, že vo väčšine prípadov je histogram roztrúsený a citlivý na šum, v [35] bol navrhnutý kumulovaný histogram (Cumulated Color Histogram).
Popri farebnom histograme boli použité rôzne iné reprezentácie farebných príznakov. Na prekonanie kvantizačných efektov použili [35] Color Moment - momenty farieb. Matematickým základom tejto myšlienky je fakt, že každá distribúcia farieb môže byť charakterizovaná jej momentmi. Navyše bolo zistené, že väčšina podstatnej informácie je sústredená v momentoch nižšieho rádu; v momentoch prvého (priemer), druhého (rozptyl) a tretieho rádu (skewness). Na určenie podobnosti bola použitá vážená Euklidovská vzdialenosť.
Na určenie podobnosti histogramov sa najčastejšie používa metrika $L_{1}$[70], $L_{2}$[45]. Ak histogram obrazu je definovaný ako vektor $H(M) =
(h_{c_{1}},h_{c_{2}},\dots,h_{c_{n}})$ pričom $h_{c_{i}}$ je počet bodov s jasovou hodnotou $c_{i}$ v obraze $M$, a $n$ je počet hladín. Bez straty všeobecnosti si môžeme zadefinovať, že každý obraz má $N$ bodov, pričom $\sum_{i=1}^{n}h_{c_{i}} = N$. Vzdialenosť medzi dvomi farebnými histogramami $H$, $I$ dané metrikou $L_{1}$ je definované ako
\begin{displaymath}
d_{L_{1}} (H,I) = \sum_{l=1}^{n}\vert h_{c_{l}} - i_{c_{l}} \vert
\end{displaymath} (3.4)

Metrika zadefinovaná [45] využíva podobnosť farieb v histograme. Usporiadame zásobníky tak, aby susediace zodpovedali podobným farbám. Ak podobnosť farieb $j$-tého a $l$-tého zásobníka je $a_{jl}$ a symetrická matica $A$ s prvkami $a_{jl}$ je kladne definitná, potom

\begin{displaymath}
d_{A}(H,I) = \sqrt{(H-I).A.(H-I)^{T}}
\end{displaymath} (3.5)

definuje metriku $L_{2}$ v priestore farebných histogramov.
Color Sets - množina farieb, bola uvedená ako aproximácia farebného histogramu a použitá na urýchlenie prehľadávania veľkej množiny obrazov v [67]; tento prístup spočíva v transformácii z (R,G,B) farebného priestoru do priestoru uniformného z hľadiska vnímania (X,Y,Z), napr. farebný priestor (H,S,V).
\begin{displaymath}
(x,y,z) = T(r,g,b)
\end{displaymath} (3.6)

Každej trojici $(r,g,b)$ zodpovedá obraz $(x,y,z)$ po aplikovaní transformácie T. Následne sa výkona kvantovanie farieb do M zásobníkov. Nech $Q_{M}$ je funkcia, ktorá vykoná vektorové kvantovanie, t.j. mapuje trojicu $(x,y,z)$ do jednej z $M$ zásobníkov. Potom $m \in \{0,\dots,M-1\}$ je index farby $(x,y,z)$ priradený funkciou $Q_{M}$ a je daný vzťahom
\begin{displaymath}
m = Q_{M}(x,y,z)
\end{displaymath} (3.7)

Binárny farebný priestor $B^{M}$ (Binary Color Space) je $M$-rozmerný binárny priestor ktorý zodpovedá indexom produkovaným pomocou $Q_{M}$, pričom každý index $m$ reprezentuje jednu os priestoru.

Napríklad nech $T$ robí transformáciu medzi farebnými priestormi $RGB$ a $HSV$, a nech $Q_{M}, M=8$ vektorovo kvantuje priestor $HSV$. Potom $B^{8}$ je osemrozmerný binárny priestor, pričom každá os zodpovedá jednej farbe v kvantovanom $HSV$ priestore. Množina farieb (Color Set) je definovaná ako výber farieb z kvantovaním rozdeleného farebného priestoru. Keďže vektory popisujúce Color Set boli binárne bolo možné realizovať efektívne a rýchle prehľadávanie. Vzťah farebného histogramu a množín farieb bol preberaný v [68].

Adrian Toth 2005-11-16