본문 바로가기
CS/인공지능

컴퓨터 시각과 패턴인식 문제 풀이 - 4이웃 8이웃 연결성, 표본화 및 양자화, 평활화, 소벨 연산자, 결정이론적 패턴, 언어이론적 패턴, 거리 측정, KNN

by Renechoi 2024. 5. 19.

컴퓨터 시각과 패턴인식

 

1. 표본화 및 양자화의 개념에 대해 설명하라.

 

표본화란 연속적인 아날로그 신호를 이산신호로 변환하는 것이다. 이때 정해진 간격에 따라 아날로그 신호의 값을 취한 표본을 구한다. 나이키스트의 표본화 이론에 따르면 원래 신호가 포함하고 있는 최대 주파수의 2배 이상의 속도로 표본화할 경우 원래 신호를 완전히 복원해 낼 수 있다. 이와 같이 구한 이산신호를 디지털 신호로 만드는 과정에서 양자화를 한다. 양자화는 값의 구간을 어떠한 방법에 따라 분할하여 해당 구간에 대한 대표값을 부여해 주는 과정이다. 이때 양자화 구간을 넓히면 양자화 단계수를 줄이면서 표본화된 데이터를 디지털 데이터로 표현하는 데 소요되는 정보량은 줄어들 수 있지만 데이터 손실이 커진다.

 

2. 소벨 연산자에 대하여 설명하라.

 

소벨 연산자는 1차 미분을 이용하여 영상의 에지의 위치와 방향을 구하기 위한 연산자이다. 이를 위해 다음의 2개의 마스크를 사용한다.

\[
M_{SobelH} = \frac{1}{4} \begin{bmatrix}
-1 & 0 & 1 \\
-2 & 0 & 2 \\
-1 & 0 & 1 
\end{bmatrix}
\]

\[
M_{SobelV} = \frac{1}{4} \begin{bmatrix}
-1 & -2 & -1 \\
0 & 0 & 0 \\
1 & 2 & 1 
\end{bmatrix}
\]

\( M_{SobelH} \)는 수평방향의 영상 변화를, \( M_{SobelV} \)는 수직방향의 영상 변화를 구한다. \((x, y)\) 좌표에서 \( M_{SobelH} \)와 \( M_{SobelV} \)를 이용하여 구한 수평 및 수직 에지를 각각 \( e_h(x, y) \), \( e_v(x, y) \)라 할 때 이 위치에서 에지 강도 \( e_{Sobel} \)은 다음과 같다.

\[
e_{Sobel}(x, y) = \sqrt{e_h(x, y)^2 + e_v(x, y)^2}
\]

또한 영상 변화의 방향은 다음과 같다.

\[
\theta_{Sobel}(x, y) = \tan^{-1} \left( \frac{e_v(x, y)}{e_h(x, y)} \right)
\]

 

 

 



3. 주성분 분석에 대하여 설명하라.

고차원의 특징공간을 저차원의 특징공간으로 축소하기 위한 기술이다. 기존 특징공간을 직교변환하여 특정요소 간 상관관계를 최소화하는 공간으로 변환한다. 그 과정은 표본 데이터 집합을 투영하였을 때 분산이 가장 커지는 축을 첫 번째 주성분 축으로 정하고, 이 축과 직교하면서 표본 데이터 집합을 투영하였을 때 분산이 가장 커지는 축을 둘째 주성분 축으로 정하는 것을 반복하여 새로운 좌표계를 만들어 표본 데이터를 선형변환하는 것이다. 그 결과 식별에 도움이 되지 않는 축의 성분을 제거해 차원 축소를 할 수 있다.

 


4. 학습표본으로부터 확률밀도를 결정하는 방법 중 매개변수 방식과 비매개변수 방식에 대하여 설명하라.

매개변수 방식은 특정공간상에서 패턴의 분포가 잘 알려진 모델을 따른다고 가정하고, 이 확률모델의 매개변수들을 학습표본 집합을 이용하여 추정한다. 최대가능도 추정(MLE)이 매개변수 방식의 예에 해당된다. 만일 가정한 모델이 실제 대상에 잘 맞는 경우 몇 개의 매개변수만 추정하면 분류기를 만들 수 있지만, 그렇지 않다면 오류가 발생할 가능성이 높아진다. 

 

반면 비매개변수 방식에서는 유사한 입력은 유사한 출력을 낸다고 가정한다. 미지의 패턴에 대한 특정 벡터가 주어지면 정해진 거리측정자와 학습표본 집합을 이용하여 각각의 클래스에 속할 확률이나 거리 등을 계산하여 분류한다. 그러려면 많은 양의 학습표본을 기억해야 하며, 거리계산의 대상이 많으므로 계산복잡도가 높다는 단점이 있다.

 

 

 


 

 

 

1. 디지털 영상의 입력에 대한 올바른 설명은?

① 표본화는 입력된 데이터를 정수값으로 표현하는 과정이다.  
② 양자화는 원래의 값을 그대로 유지한다.  
③ 레인지 영상은 빛의 밝기를 입력한 영상이다.  
④ 표본화 간격을 나이키스트 간격보다 조밀하게 하면 원래 신호를 복원해 낼 수 있다.

 

정답: 4
해설: 표본화는 연속적으로 변환하는 아날로그 신호를 이산신호로 변환하는 것이다. 이때 아날로그 신호가 가지고 있는 최대 주파수의 2배 이상의 빠르기로 표본화하여 표본화 간격을 줄이면 이론적으로 원래 신호를 그대로 복원할 수 있다. 이 주파수에 해당되는 표본화 간격을 나이키스트 간격이라고 한다.

2. 다음 중 4-이웃 연결성을 적용할 때 픽셀 \( p \)의 이웃 픽셀들은?

\[
\begin{array}{ccc}
(ㄱ) & (ㄴ) & (ㄷ) \\
(ㄹ) & p & (ㅁ) \\
(ㅂ) & (ㅅ) & (ㅇ) \\
\end{array}
\]

① (ㄱ), (ㄷ), (ㅂ), (ㅇ)  
② (ㄱ), (ㄴ), (ㄷ), (ㄹ), (ㅁ), (ㅂ), (ㅅ), (ㅇ)  
③ (ㄴ), (ㄹ), (ㅁ), (ㅅ)  
④ (ㄴ), (ㅂ), (ㅅ), (ㅇ)

 

정답: 3
해설: 4-이웃 연결성은 가장 가까운 4개의 픽셀을 이웃으로 정의한 것, 8-이웃 연결성은 가장 가까운 8개의 픽셀을 이웃으로 정의한 것이다.

 



4-이웃:
\[
\begin{array}{ccc}
□ & ■ & □ \\
■ & p & ■ \\
□ & ■ & □ \\
\end{array}
\]

8-이웃:
\[
\begin{array}{ccc}
■ & ■ & ■ \\
■ & p & ■ \\
■ & ■ & ■ \\
\end{array}
\]

 

 

 

3. 다음 중 영상의 평활화를 위한 필터 마스크는?

① \(\frac{1}{16}\begin{bmatrix}
1 & 2 & 1 \\
2 & 4 & 2 \\
1 & 2 & 1 \\
\end{bmatrix}\)

② \(\begin{bmatrix}
1 & -2 & 1 \\
-2 & 4 & -2 \\
1 & -2 & 1 \\
\end{bmatrix}\)

③ \(\frac{1}{4}\begin{bmatrix}
-1 & 0 & 1 \\
-2 & 0 & 2 \\
-1 & 0 & 1 \\
\end{bmatrix}\)

④ \(\frac{1}{4}\begin{bmatrix}
-1 & -2 & -1 \\
0 & 0 & 0 \\
1 & 2 & 1 \\
\end{bmatrix}\)

 

정답: 1
해설: 평활화(smoothing) 필터는 상에 포함된 잡음을 제거하기 위해 한 픽셀의 값을 그 픽셀을 중심으로 한 이웃 픽셀들과의 가중치 평균을 구하는 것을 의미한다. ②는 라플라스 연산자, ③과 ④는 소벨 연산자이다.

 


4. 작은 점이 뿌려진 것과 같은 점잡음이 있는 영상에 적용할 경우 효과가 큰 필터는?

① 라플라시안 필터  
② 가우시안 평활화 필터  
③ 소벨 필터  
④ 중간값 필터  

 

정답: 4
해설: \(n \times n\) 크기의 중간값 필터는 원 영상의 각각의 픽셀 위치에 대하여 그 위치를 중심으로 \(n \times n\) 영역에 속한 픽셀의 그레이 레벨값을 크기순으로 나열한 후, 그 중 중간값을 그 픽셀 위치에 대한 결과 영상의 픽셀값으로 취하는 것이다. 그 결과 점잡음에 해당되는 픽셀이 제거되는 효과를 얻을 수 있다. 그러나 원래 있던 작은 점이나 가느다란 직선 등이 함께 제거되는 문제점이 있을 수 있다. 가우시안 평활화 필터 역시 잡음제거의 역할을 하나 점잡음에 대해서는 중간값 필터가 더 우수하다.

 


5. 다음 중 영상에서 에지를 검출하기 위해 사용되는 것은?

① 가우시안 필터  
② 중간값 필터  
③ 소벨 연산자  
④ 저역통과 필터  

 

정답: 3
해설: 영상에서 에지(edge)란 밝기가 다른 두 영역 사이의 픽셀의 그레이 레벨이 크게 변하는 부분을 의미한다. 소벨 연산자는 1차 미분을 계산하여 수평 및 수직 방향의 에지를 구할 수 있으며, 그 결과 에지의 크기와 방향을 구할 수 있다. 나머지 필터는 영상의 잡음을 제거하기 위한 평활화 필터에 해당된다.

6. 다음 중 2차 미분에 의해 물체의 에지를 검출하는 것은?

① 소벨 연산자  
② 라플라스 연산자  
③ 분할과 합병  
④ 가우시안 필터  

 

정답: 2

해설: 소벨 연산자는 1차 미분으로 에지를 검출하는 연산자이며, 가우시안 필터는 평활화 필터이다. 라플라스 연산자를 이용하여 2차 미분을 이용해 에지를 검출한다. 필터링 결과의 0 교차점을 찾아 경계를 구한다. 

 

 

 

7. 4-이웃 연결성을 사용할 경우 픽셀 \( p \)로부터 연결되는 경로가 존재하는 픽셀이 아닌 것은?

 

 

정답: 3
해설: 4-이웃 연결성의 경우는 상하좌우 4개의 픽셀을 이웃 픽셀로 정의한 것이다. 그러한 관점에서 ③은 연결되지 않은 독립된 픽셀이다.

 

 

8. 균일한 밝기의 배경 위에 균일한 밝기의 물체가 놓여 있을 때 그레이 레벨 히스토그램이 아래 그림과 같이 나왔다. 배경과 물체를 구분하는 그레이 레벨은 어느 점이 적절한가?

 

정답: 3
해설: 균일한 배경에 해당되는 히스토그램 영역과 균일한 밝기의 물체에 해당되는 히스토그램 영역에 2개의 피크를 갖는 히스토그램이다. 이 경우 두 피크 사이의 최저점에 해당되는 곳을 임계치로 정할 수 있다.



9. 패턴인식 단계 중 크기, 위치 등이 변형된 인식 대상 패턴을 학습 시의 기준 패턴과 같은 조건으로 변환하는 과정은?

① 관측  
② 표본화  
③ 양자화  
④ 정규화

 

정답: 4
해설: 관측은 대상패턴을 입력장치를 통해 취득하는 것, 표본화는 연속적인 신호를 이산신호로 변환하는 것, 양자화는 각각의 표본값을 디지털값으로 변환하는 과정을 의미한다. 

 

 

 

10. 패턴인식을 위한 특징추출의 목적에 해당되는 것은?

① 여러 유형의 패턴에 대해 유사한 값을 얻기 위해  
② 특징계산을 위한 알고리즘의 시간복잡도를 높이기 위해  
③ 식별에 도움이 되는 정보만 취하여 인식에 사용하기 위해  
④ 아날로그 신호를 디지털 신호로 변환하기 위해  

 

정답: 3
해설: 특징은 인식 대상 패턴 중에서 어떠한 패턴을 다른 패턴과 구분하기 위해 사용될 수 있는 정보를 추출한 것으로, 원 데이터 대신 특징을 추출하여 사용하는 이유는 패턴공간의 차수를 낮추어 처리 효율성을 높이고, 판별작업에 더욱 적합하도록 의미 있는 값을 얻고자 하는 것이다.



11. 패턴인식에 사용할 특징의 조건으로 적절하지 않은 것은?

① 계산에 의해 구할 수 있는 것  
② 서로 다른 패턴은 서로 다른 값을 갖는 것  
③ 처리해야 할 데이터의 양을 늘릴 수 있는 것  
④ 패턴의 유용한 정보를 잃지 않는 것  

 

정답: 3
해설: 특징은 계산에 의해 구할 수 있어야 하고, 다른 패턴과의 구분에 도움이 되는 것이어야 하며, 유용한 정보를 잃지 않으면서 데이터를 처리할 수 있는 양으로 줄일 수 있어야 한다.

 


12. 계량공간이 만족해야 하는 거리측정자 \( J \)의 조건에 해당되는 것은?

① \( J(x, y) \leq 0 \)  
② \( J(x, y) = 0 \) iff \( x = y \)  
③ \( J(x, y) \neq J(y, x) \)  
④ \( J(x, y) + J(y, z) \leq J(x, z) \)  

 

정답: 2
해설: 자기 자신과의 거리는 0이므로 \( J(x, x) = 0 \)이어야 하며, 역으로 \( J(x, y) = 0 \)인 경우 두 점 \( x \)와 \( y \)는 같은 위치에 있다. 거리는 음수가 될 수 없으므로 \( J(x, y) \geq 0 \)이어야 한다. \( x \)로부터 \( y \)까지의 거리는 \( y \)로부터 \( x \)까지의 거리와 같으므로 \( J(x, y) = J(y, x) \)이고, 두 점 사이의 거리는 제3의 점을 거쳐서 가는 거리보다는 짧아야 하므로 \( J(x, y) + J(y, z) \geq J(x, z) \)이다.

 

 

 

13. 패턴 \( a \)와 \( b \) 사이의 도시블록 거리에 해당되는 것은? 단, \( d \)는 특징공간의 차수, \( x_{ik} \)는 패턴 \( k \)의 \( i \)번째 특징값이다.

\[
① \left\{ \sum_{i=1}^{d} (x_{ia} - x_{ib})^2 \right\}^{1/2}
\]
\[
② \sum_{i=1}^{d} (x_{ia} \oplus x_{ib})
\]
\[
③ \sum_{i=1}^{d} (x_{ia} - x_{ib})
\]
\[
④ \sum_{i=1}^{d} | x_{ia} - x_{ib} |
\]

 

정답: 4
해설: 도시블록 거리(맨해튼 거리)는 특정공간의 각 차원별 거리의 합산으로 정의된다. ①은 유클리드 거리, ②는 특정값이 0 또는 1 중 하나일 경우에 사용하는 해밍거리이다.

 



14. 다음 중 군집의 평균벡터와 공분산행렬을 고려한 거리측정자는 무엇인가?

① 마할라노비스 거리  
② 해밍거리  
③ 맨해튼 거리  
④ 유클리드 거리  

 

정답: 1
해설: 마할라노비스 거리는 특정공간상에서 균질의 분포를 고려하여 거리를 측정하는 통계적 척도이다.



15. 다음 중 학습표본으로부터 확률밀도를 결정하는 방법에 대한 올바른 설명은?

① 비매개변수 방식은 패턴의 분포가 잘 알려진 확률모델을 따른다고 가정한다.  
② \( k \)-NN 방식은 매개변수 방식으로 확률밀도를 결정하여 인식한다.  
③ 매개변수 방식은 많은 양의 학습표본을 기억하고 있어야 하며, 거리 계산의 대상이 많으므로 식별 단계에서 계산복잡도가 높다.  
④ 최대가능도 추정은 학습표본 데이터 집합이 관찰될 가능성이 최대인 매개변수를 찾아 모집단의 매개변수를 추정하는 방법이다.  

 

정답: 4
해설: 매개변수 방식은 특정공간상에서 패턴의 분포가 잘 알려진 모델을 따른다고 가정하여 모집단의 확률모델의 매개변수를 표본집합으로부터 추정하는 방식이다. 최대가능도 추정(maximum likelihood estimation)은 확률모델의 매개변수를 추정하는 방식으로, 학습표본 데이터 집합이 관찰될 가능성이 최대인 매개변수를 찾는 것이다. \( k \)-NN은 비매개변수 방식에 해당된다.

 

 

 

 

16. \( k \)-NN에 대한 올바른 설명은?

① 언어이론적 패턴인식 방법이다.  
② \( k \)개의 값으로 이루어진 특징을 이용한 인식방법이다.  
③ 학습표본 중 인식 대상과 가장 가까운 \( k \)개의 표본을 구한다.  
④ 식별함수 1개의 선형함수로 표현되는 경우에 사용한다.  

 

정답: 3
해설: \( k \)-NN은 결정이론적 패턴인식 방법 중 하나로, 미지의 패턴과 가장 거리가 가까운 \( k \)개의 표본을 취한 후, 선택된 표본이 어느 클래스에 가장 많이 속하는가에 따라 판정한다.

 



17. \( k \)-NN을 인식방법으로 사용할 때, 거리측정자가 (ㄱ) 도시블록 거리를 사용하는 경우와 (ㄴ) 유클리드 거리를 사용하는 경우 \( x \)를 어느 패턴으로 인식하게 되는가? 단, \( k = 3 \)이다.

 

 

 

 

 

정답: 2
해설: 도시 블록 거리를 사용할 경우 \( x \)와 \(\bullet\)들 사이의 거리는 가까운 것부터 5, 7, 9, 11이고, \( x \)와 \(\square\)들 사이의 거리는 5, 6, 9, 10이다. \( k = 3 \)의 경우 \(\bullet\) 1개, \(\square\) 2개 선택되므로 \(\square\)로 인식한다. 반면 유클리드 거리를 사용하는 경우 \( x \)와 \(\bullet\)들 사이의 거리는 가까운 것부터 4.12, 5, 8.54, 9이고, \( x \)와 \(\square\)들 사이의 거리는 4.12, 6, 6.71, 9.06이다. 이 경우는 \(\bullet\) 2개, \(\square\) 1개 선택되므로 \(\bullet\)로 인식한다.

 

 

 

 

 


 

 

 

1. 작은 점이 뿌려진 것과 같은 점잡음이 있는 영상에 적용할 경우 효과가 큰 필터는?

① 라플라시스 연산자  
② 가우시안 평활화 필터  
③ 소벨 필터  
④ 중간값(median) 필터  

 

정답: 4

해설: 정답은 ④ 중간값(median) 필터이다. 중간값 필터는 작은 점이 뿌려진 것 같은 점잡음을 제거하는 데 효과적이다. 이는 주변 픽셀 값들의 중간값을 선택해 잡음을 제거하기 때문이다. 라플라시스 연산자는 에지 검출에 사용되며, 가우시안 평활화 필터는 이미지 전체를 부드럽게 만드는 데 사용된다. 소벨 필터는 경계 검출에 사용된다.



2. 어두운 배경 위에 놓인 밝은 단색의 물체를 촬영한 영상의 히스토그램이 아래 그림과 같다. 물체영역과 배경영역을 이진화하여 분리하고자 할 때, 적절한 임계치는 무엇인가?



① a  
② b  
③ c  
④ d  

 


정답:2

해설: 정답은 ② b이다. 히스토그램에서 b 지점은 배경과 물체 영역 사이의 최저점으로, 이진화할 때 적절한 임계치이다. a 지점은 대부분 배경에 해당하며, c와 d 지점은 물체의 밝기 값에 가깝다. 따라서 b 지점을 선택해야 배경과 물체를 효과적으로 분리할 수 있다.


3. 다음 그림에 대한 픽셀 연결성 문제에 대한 올바른 설명은?

 


① 4-이웃 연결성에 따르면 백색 픽셀은 모두 연결되어 있다.  
② 8-이웃 연결성에 따르면 회색 픽셀은 모두 연결되어 있다.  
③ 4-이웃 연결성에 따르면 회색 픽셀은 모두 연결되어 있다.  
④ 8-이웃 연결성에 따르면 백색 픽셀은 2개의 분리된 영역으로 구분된다.  

 


정답: 2

해설: 정답은 ② 8-이웃 연결성에 따르면 회색 픽셀은 모두 연결되어 있다이다. 8-이웃 연결성은 픽셀이 상하좌우뿐만 아니라 대각선 방향으로도 연결될 수 있도록 하여 회색 픽셀을 하나의 연결된 영역으로 만든다. 4-이웃 연결성은 대각선 연결을 고려하지 않아 회색 픽셀을 모두 연결하지 못한다. 백색 픽셀은 4-이웃 연결성에 따라 연결되지 않으며, 8-이웃 연결성으로도 2개의 분리된 영역으로 구분되지 않는다.

 

 

 


4. 다음 중 2차 미분에 의한 에지검출 연산자는?

① 중간값 필터  
② 라플라스 연산자  
③ 가우시안 필터  
④ 소벨 연산자  

 

정답: 2

해설: 라플라스 연산자는 2차 미분을 이용하여 이미지의 에지를 검출하는 데 사용된다. 중간값 필터와 가우시안 필터는 각각 잡음 제거와 블러링에 사용되며, 소벨 연산자는 1차 미분을 이용한 에지 검출 방법이다.

 

 

 

5. 다음 중 특징이 "예-아니요", "있다-없다" 등의 불값으로 표현되는 경우 사용되는 거리측정자는?

① 유클리드 거리  
② 해밍거리  
③ 3차원 유클리드 거리  
④ 마할라노비스 거리  

 

정답: 1

해설: 해밍거리는 이진 값 간의 차이를 측정하는 데 사용되며, 불값으로 표현된 특징들에 적합하다. 유클리드 거리는 연속적인 값 간의 거리를 측정하며, 마할라노비스 거리는 분산을 고려한 거리 측정 방법이다.

 

 


6. 미지의 패턴과 가장 가까운 학습표본을 정해진 수만큼 취하여, 가장 많은 표본이 속하는 클래스로 인식하는 방법은?

① \( k \)-NN  
② A* 알고리즘  
③ c-평균 알고리즘  
④ LVQ  

 


정답: 1

해설: \( k \)-NN은 미지의 패턴과 가장 가까운 \( k \)개의 학습표본을 선택하여, 그 중 가장 많은 표본이 속하는 클래스로 인식하는 방법이다. A* 알고리즘은 최단 경로 탐색 알고리즘이고, c-평균 알고리즘은 군집화 방법이다. LVQ는 지도 학습 알고리즘이다.

 


7. 다음 중 계량공간에서 \( x \)와 \( y \) 사이의 거리를 구하는 거리측정자가 만족해야 할 공리에 해당되는 것은?

① \( J(x, y) = 0 \) iff \( x != y \)  
② \( J(x, y) \leq 0 \)  
③ \( J(x, y) = J(y, x) \)  
④ \( J(x, y) + J(y, z) \leq J(x, z) \)  

 


정답: 3

해설: 거리측정자는 대칭성을 만족해야 하며, 이는 \( J(x, y) = J(y, x) \) 조건으로 표현된다. \( J(x, y) \leq 0 \)는 거리값이 음수일 수 없으므로 틀리다. 

 

 


8. 다음 중 학습표본으로부터 확률밀도를 결정하는 방법에 대한 올바른 설명은?

① 비매개변수 방식은 패턴의 분포가 잘 알려진 확률모델을 따른다고 가정한다.  
② \( k \)-NN은 매개변수 방식으로 확률밀도를 결정하여 인식한다.  
③ 매개변수 방식은 많은 양의 학습표본을 기억하고 있어야 하며, 거리계산의 대상이 많으므로 계산복잡도가 높다.  
④ 최대가능도 추정은 학습표본 데이터 집합이 관찰될 가능성이 최대인 매개변수를 찾아 모집단의 매개변수를 추정하는 방법이다.  

 


정답: 4

해설: 정답은 ④ 최대가능도 추정은 학습표본 데이터 집합이 관찰될 가능성이 최대인 매개변수를 찾아 모집단의 매개변수를 추정하는 방법이다. 비매개변수 방식은 특정 분포를 가정하지 않고 데이터를 직접 이용하여 확률밀도를 추정한다. \( k \)-NN은 비매개변수 방식으로, 새로운 데이터의 분류는 가장 가까운 \( k \)개의 이웃을 참조하여 결정한다. 매개변수 방식은 비교적 적은 양의 데이터로 학습할 수 있으며, 많은 양의 학습표본을 기억하지 않아도 된다.

 

 

 


 

 

1. 4-이웃 연결성으로 표현되는 경계선과 8-이웃 연결성으로 표현되는 경계선의 예를 들어 보아라.

4-이웃 연결성은 픽셀의 상하좌우 네 방향만을 연결된 이웃으로 간주하여 경계를 표현한다. 예를 들어, 체스판 패턴의 중앙에 있는 백색 픽셀은 인접한 네 개의 회색 픽셀과만 연결된다. 8-이웃 연결성은 상하좌우뿐만 아니라 대각선 방향까지 포함한 여덟 방향을 연결된 이웃으로 간주하여 경계를 표현한다. 예를 들어, 같은 체스판 패턴에서 중앙의 백색 픽셀은 인접한 모든 방향의 회색 픽셀과 연결된다.

 


2. 표본화 및 양자화의 개념에 대해 설명하라.

표본화는 연속적인 신호를 불연속적인 시간 간격으로 변환하는 과정이다. 이를 통해 아날로그 신호는 이산적인 시간 점으로 구성된 디지털 신호로 변환된다. 양자화는 표본화된 값을 유한한 개수의 이산적인 값으로 변환하는 과정이다. 이 과정에서 연속적인 진폭 값을 정해진 레벨로 근사화하여 표현하며, 이를 통해 디지털 신호의 각 표본이 일정한 비트 수로 표현된다.

 


3. 영상을 선명하게 만드는 필터에 대해 조사하라.

영상을 선명하게 만드는 필터에는 고주파 통과 필터(High-pass filter)와 언샤프 마스크(Unsharp mask) 필터가 있다. 고주파 통과 필터는 영상에서 저주파 성분을 제거하여 경계와 에지를 강조한다. 언샤프 마스크 필터는 원본 영상에서 블러링된 영상을 빼는 방식으로 고주파 성분을 강조하여 영상의 선명도를 높인다. 이 필터는 이미지의 경계와 디테일을 뚜렷하게 하여 선명하게 만드는 데 효과적이다.

 


4. 소벨 마스크 외에 에지를 구하는 마스크에 대해 조사하라.

소벨 마스크 외에 에지를 구하는 마스크에는 프리윗 마스크(Prewitt mask)와 라플라시안 마스크(Laplacian mask)가 있다. 프리윗 마스크는 소벨 마스크와 유사하지만, 더 단순한 차분 연산을 사용하여 에지를 검출한다. 라플라시안 마스크는 2차 미분을 이용하여 에지를 검출하며, 에지의 강도를 계산하여 더 정확한 에지 위치를 찾는 데 사용된다. 이 마스크들은 각각의 특성에 따라 다양한 영상 처리 응용에 활용된다.

 

 

5. 분할과 합병 알고리즘을 간략히 설명하라.

분할과 합병 알고리즘은 이미지를 보다 작은 영역으로 분할한 다음, 이들을 다시 합병하여 원하는 특징을 추출하는 방식이다. 이 알고리즘은 이미지의 각 부분이 일정한 기준을 만족하지 않을 때까지 분할하고, 분할된 영역들이 동일한 기준을 만족하면 합병한다. 이러한 과정은 이미지의 구조적 특징을 효과적으로 분석할 수 있게 하며, 특히 복잡한 이미지의 객체 인식이나 경계 검출에 유용하다.

 


6. 특징이란 무엇인지 설명하고, 특징추출을 함으로써 얻을 수 있는 효과에 대해 설명하라.

특징이란 이미지나 데이터에서 중요한 정보를 나타내는 요소로, 패턴 인식과 분류를 위해 사용된다. 예를 들어, 이미지에서는 에지, 모서리, 코너 등이 특징이 될 수 있다. 특징추출은 이러한 중요한 정보를 추출하는 과정으로, 데이터를 더 간결하게 표현하고 분석을 용이하게 한다. 특징추출을 통해 데이터의 차원을 축소시켜 연산 속도를 높이고, 노이즈를 줄이며, 패턴 인식의 정확도를 향상시킬 수 있다.

 


7. 결정이론적 방법과 언어이론적 방법의 특징을 비교하라.

결정이론적 방법은 수학적 모델을 기반으로 패턴을 분류하고 인식하는 방식이다. 이 방법은 주로 확률 이론과 통계학을 사용하여 각 클래스에 대한 결정을 내린다. 특징으로는 계산적 복잡도가 낮고, 정확도가 높은 반면, 사전 확률이나 비용 함수 등의 파라미터 설정이 필요하다.

언어이론적 방법은 패턴을 언어적인 구조로 표현하고, 규칙이나 문법을 기반으로 인식하는 방식이다. 이 방법은 주로 형식 언어와 문법을 사용하여 패턴을 분석한다. 특징으로는 복잡한 패턴을 표현하는 데 유리하며, 구조적인 패턴 인식이 가능하지만, 계산적 복잡도가 높고, 규칙 설계가 어렵다.

 

 


8. 3차원 공간상에서 표본 \(x_1\)과 \(x_2\)가 각각 \((1, 3, 2)\)와 \((3, 3, 5)\)에 존재한다고 할 때, \(x_1\)과 \(x_2\) 사이의 유클리드 거리와 도시블록 거리는 각각 얼마인가?

 

 

주어진 두 표본 \(x_1\)과 \(x_2\)의 좌표가 각각 \((1, 3, 2)\)와 \((3, 3, 5)\)일 때, 유클리드 거리와 도시블록 거리를 계산해보자.

 


1. 유클리드 거리:

유클리드 거리는 두 점 사이의 직선 거리를 의미하며, 다음 공식으로 계산된다:
\[ d_{\text{Euclidean}} = \sqrt{(x_2 - x_1)^2 + (y_2 - y_1)^2 + (z_2 - z_1)^2} \]

주어진 좌표를 대입하면:
\[ d_{\text{Euclidean}} = \sqrt{(3 - 1)^2 + (3 - 3)^2 + (5 - 2)^2} \]
\[ d_{\text{Euclidean}} = \sqrt{(2)^2 + (0)^2 + (3)^2} \]
\[ d_{\text{Euclidean}} = \sqrt{4 + 0 + 9} \]
\[ d_{\text{Euclidean}} = \sqrt{13} \]
\[ d_{\text{Euclidean}} \approx 3.61 \]

 


2. 도시블록 거리:

도시블록 거리는 두 점 사이의 축에 평행한 경로를 따라 이동한 거리를 의미하며, 다음 공식으로 계산된다:
\[ d_{\text{Manhattan}} = |x_2 - x_1| + |y_2 - y_1| + |z_2 - z_1| \]

주어진 좌표를 대입하면:
\[ d_{\text{Manhattan}} = |3 - 1| + |3 - 3| + |5 - 2| \]
\[ d_{\text{Manhattan}} = |2| + |0| + |3| \]
\[ d_{\text{Manhattan}} = 2 + 0 + 3 \]
\[ d_{\text{Manhattan}} = 5 \]

따라서, \(x_1\)과 \(x_2\) 사이의 유클리드 거리는 약 3.61이고, 도시블록 거리는 5이다.

 

 

 

 


 

 

1. 컴퓨터 시각 시스템의 처리 단계 중 영상의 잡음을 제거하거나 영상을 개선하는 등의 처리를 통해 이어지는 처리를 하기 좋은 형태로 가공하는 단계는?

 

1) 전처리
2) 영상분할
3) 영상표현
4) 양자화

 

정답: 1해설 : 전처리란 취득한 영상을 보다 처리하기 좋은 형태로 가공하는 처리이다. 훼손된 영상을 복원하거나 영상을 개선하거나 변환하는 등의 제반 처리가 이에 해당된다.

 

2. 픽셀 값들이 다음 그림과 같을 때 가우시안 저역통과 필터마스크 M을 적용하면 현재 180이 저장되어 있는 픽셀의 값이 어떠한 값이 되는가?

 

 

 

1) 49
2) 50
3) 60
4) 83

 

정답: 4

해설 : 해당 픽셀을 중심으로 필터 마스크를 적용하면 그 값은 다음과 같으며, 이를 정수 값으로 반올림한 값을 구한다.
(59 + 2×50 + 48 + 2×54 + 4×180 + 2×50 + 52 + 2×49 + 47) / 16 = 83.25

 

 

3. 픽셀 값들이 다음 그림과 같을 때 3×3 크기의 중간값 필터를 적용하면 현재 180이 저장되어 있는 픽셀의 값이 어떠한 값이 되는가?

 

 

 

1) 49
2) 50
3) 60
4) 83

 

정답: 2

해설 : 해당 픽셀을 중심으로 3×3 개의 픽셀 값들을 취하면

      (59, 50, 48, 54, 180, 50, 52, 49, 47) 이며,

      이를 오름차순으로 정렬하면

      (47, 48, 49, 50, 50, 52, 54, 59, 180) 이다.

      이때 중간값은 50이므로 필터링 결과 해당 픽셀의 값은 50이 된다.

 

 

 

 

 

4. 다음과 같은 그레이레벨 히스토그램을 갖는 영상이 있을 때, 이 영상을 이진화하기 위해 적합한 임계치에 해당되는 값은?

 

 

1) 32
2) 64
3) 96
4) 128

 

정답:  2

해설 : 2정점 형태의 그레이레벨 히스토그램을 갖는 경우 두 정점 사이의 최솟값 부근의 그레이레벨을 임계치로 선택하는 것이 좋다.

 

 

5. 다음 중 소벨 연산자의 마스크에 속하는 것은?

 

 

1)

 

2)

 

3)

 

4)

 

정답: 1

해설 : 소벨 연산자는 가로 방향의 밝기 변화를 계산하는 연산자와 세로 방향의 밝기 변화를 계산하는 연산자의 2개의 1차 미분 연산자로 정의된다. ①은 가로 방향의 밝기 변화를 계산하는 소벨 연산자이다. ②와 ③은 평활화 필터이며, ④는 라플라스 연산자에 해당된다.

 

 


 

1. 다음 중 주어진 표본 공간을 직교변환을 통해 특징요소 사이의 상관관계를 최소화하는 공간으로 변환한 후 식별에 도움이 되는 성분만으로 표현함으로써 차원 축소를 할 수 있는 기술을 일컫는 것은?

 

1) 파즌 창
2) 패턴의 정규화
3) 주성분 분석(PCA)
4) HoG(Histogram of Oriented Gradients)

 

정답: 3

해설 : 주성분 분석은 주성분 축(데이터를 투영한 결과의 분산이 가장 큰 축)들로 구성된 공간으로 선형 직교변환을 한 다음, 그 중 큰 분산을 갖는 축으로 구성된 저차원의 데이터 공간으로 표현함으로써 특징 차원을 축소할 수 있게 하는 기술이다. 파즌 창은 비 매개변수 방식으로 표본집합으로부터 확률밀도함수를 추정하는 기법이다. 정규화는 패턴의 변형을 회복하여 기준이 되는 패턴으로 변환하는 처리이다. HoG는 영상의 특정 영역에서 변화의 방향에 대한 히스토그램을 구하는 방식의 특징 추출 방법이다.

 

 

2. 베이즈 분류기에서 특징벡터 x로 표현되는 패턴이 클래스 C1과 C2중 어디에 속하는지 식별하고자 한다. 다음 중 C1으로 식별하는 경우는?

 

1) p(C1 | x) > p(C2 | x)
2) p(C1) ≤ p(C2)
3) p(x | C1) ≤ p(x | C2)
4) p(C1)p(x) ≥ p(C2)p(x)

 

정답: 1

해설 : 패턴 x가 관측되었다는 가정하에 C1 또는 C2에 속할 조건확률을 계산하여 식별한다.

 

 

3. 다음 중 학습표본으로부터 확률밀도를 결정하는 방법에 대한 올바른 설명은?

 

1) 비 매개변수 방식은 패턴의 분포가 잘 알려진 확률 모델을 따른다고 가정한다.
2) k - 근접이웃 방식은 매개변수 방식으로 확률밀도를 결정하여 인식한다.
3) 매개변수 방식은 많은 양의 학습 표본들을 기억하고 있어야 하며, 거리 계산의 대상이 많으므로 계산 복잡도가 높다.
4) 최대가능도 추정은 학습 표본 데이터 집합이 관찰될 가능성이 최대인 매개변수를 찾아 모집단의 매개변수를 주정하는 방법이다.

 

정답: 4

해설 : 매개변수 방식은 특징공간상에서 패턴의 분포가 잘 알려진 모델을 따른다고 가정하여 모집단의 확률 모델의 매개변수를 표본집합으로부터 추정하는 방식이다. 최대가능도 추정(maximum likelihood estimation)은 확률 모델의 매개변수를 추정하는 방식으로, 학습 표본 데이터 집합이 관찰될 가능성이 최대인 매개변수를 찾는다. k - 근접이웃은 비 매개변수 방식이다.

 

 

4. 패턴인식 방법 중 - 근접이웃(- NN)에 대한 설명으로 올바른 것은?

 

1) 매개변수 방식의 확률밀도 결정을 한다.
2) 미지의 패턴과 가장 가까운 k 개의 학습 표본을 구하였을 때 가장 많은 표본이 속하는 클래스로 식별한다.
3) 최대가능도 추정 방식으로 확률분포의 매개변수를 결정한다.
4) 확률 분포가 가우시안 분포라고 가정한다.

 

정답: 2

해설 : k - NN은 어떠한 벡터가 특정 클래스에 속할 확률을 그 표본과 가장 가까운 k 개의 표본 벡터 중 해당 클래스의 표본 수의 비율로 정하는 미 매개변수 방식의 분류기이다.

 

 






참고 자료: 

- 인공지능 (이광형,이병래 공저 | 한국방송통신대학교출판문화원 | 2018)

반응형