pizzaplanet

Pattern Recognition Fundamentals 본문

Univ./Pattern Recognition lecture

Pattern Recognition Fundamentals

scio 2018. 3. 31. 01:32

학교에서 듣는 패턴인식에 대하여 정리를 해나가고자 한다.


What is a Pattern? 패턴이란?



패턴이란 [ 정렬된 or 모호하게 정의 된 ] 것들로 물리적 오브젝트를 설명하는 추상적 객체로 볼 수 있다.

예> 지문, 손글씨, 안면, 음성, DNA 서열 등

[ Examples of Patterns ]






What is Pattern Recognition? 패턴 인식이란?




패턴인식은 머신이 아래의 각 사항들을 할 수 있는 방법에 대한 것이다.
- 환경 관찰
- 관심 있는 패턴 구분
- 패턴 카테고리를 합리적으로 결정
- 오브젝트를 범주 또는 클래스로 분류



Pattern Recognition Applications
패턴 인식 어플리케이션


예를 들어 의학분야에서는 Input 데이터로 영상이미지를 사용하여 분류 결과가 암세포 or 정상세포로 나온다는 것.


[ 필기체 인식 ]



[ 지문 인식 ]



[ 암세포 탐지 ]



[ 차량 번호판 인식 ]







Terminology

용어




Feature

- 데이터 셋의 특성 정보를 담은 변수이다. 작년 ETRI와 진행했던 '모바일 게임 유저로그를 이용한 게임 이탈 예측'을 예로 들어보자.

전체로그에 각 유저의 경험치, 접속일, 게임머니보유량, 이동거리, 플레이시간 등의 항목(특징이 될 만한)이 있고 각 항목이 Feature가 될 수 있다. 전체로그에서 Feature를 추출하여 AI 알고리즘에 넣어주면 게임 이탈 예측을 해주게 되는 것.


Feature vector
- 간단하게 피쳐들의 집합이라 생각하면 된다. 위키의 말을 빌리자면 "굳이 벡터로 표시하는 이유는 수학적으로 다루기 편하기 때문이다. 피쳐라는 개념을 가져온 것은 선형 회귀와 같은 통계학적인 기법에서이다. 독립 변수와 종속 변수 개념 또한 통계학에서 가져왔다." 

Feature space

- 피쳐벡터가 있는 d차원의 공간

d차원 벡터는 d차원의 공간에서 점을 구성한다.

( IBM® IBM Knowledge Center )

Class

- 주어진 객체가 속하는 카테고리다. 앞서 예를 들었던 게임 이탈 예측에서의 Class는 이탈과 비이탈이다. 경험치, 접속일 등의 데이터를 받아 AI 알고리즘을 통해 유저가 이탈 Class에 속할지 비이탈 Class에 속할지 분류(Classification)한다.


Pattern

- Class 정보가 잘 레이블링 되고, 신중하게 고려된 feature의 집합


Instance/Exemplar

- 오브젝트에 대해 주어진 예시 패턴


Training Data, Test Data

- AI 를 이용하여 결과를 얻기 위해서는 우선 AI를 Training(훈련, 학습) 시켜야 한다. 이때 쓰는 것이 Training Data이다. 

AI가 Training Data를 이용하여 학습한 후 제대로 학습이 되었는지를 Test Data를 이용하여 확인한다. 예를 들어 100G의 데이터 중 70G(training data)는 AI를 학습시키고 남은 30G의 데이터(Test Data)를 AI에 집어 넣어 결과를 얻어내어 학습이 잘 되었는지 확인한다.

( Harvard Univ. #AM207 )


Field Test Data

- 어느 Class로 분류할지 알려지지 않은 데이터.


Decision boundary

- 클래스들을 분리해주는 d차원 공간의 경계



Cost Function

- 실제값과 예측값의 차이를 측정

- Classifier이 Cost Function을 최소화 해주는 것


Error

- 데이터를 잘못된 클래스로 분류


Classifier

- Decision boundary를 찾기 위한 알고리즘


Training Performance

- Classifier가 트레이닝 데이터를 기반으로 학습하는 능력


Testing Performance (Generalization)

- Training된 model을 이용하여 결과값이 라벨링되지 않은 Test 데이터를 얼마나 정확하게 라벨링하는지의 능력

'Univ. > Pattern Recognition lecture' 카테고리의 다른 글

사후확률 예제 풀어보기  (0) 2018.04.24
확률에 대한 기본 정리  (0) 2018.04.24
Orthogonal / Orthonormal vectors  (0) 2018.04.23
N차원 벡터의 곱셈  (0) 2018.04.21
How PR(Pattern Recognition) works?  (0) 2018.03.31
Comments