일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- BOAZ
- aws
- GDG Campus
- Qwik Start
- ainize
- 코딩테스트
- seq2seq
- Speech
- gcp
- SageMaker
- 스터디 잼
- Community Day
- Conference
- re:Invent
- rl
- Ground Truth
- 해커톤
- 뉴비톤
- API
- SW중심대학
- 머신러닝
- OPENHACK
- 오픈소스해커톤
- Tensorflow 2.0
- CSIP
- Backend.AI
- kakao
- entity
- 구글스타트업캠퍼스
- Open Hack
- Today
- Total
pizzaplanet
Pattern Recognition Fundamentals 본문
학교에서 듣는 패턴인식에 대하여 정리를 해나가고자 한다.
What is a Pattern? 패턴이란?
패턴이란 [ 정렬된 or 모호하게 정의 된 ] 것들로 물리적 오브젝트를 설명하는 추상적 객체로 볼 수 있다.
예> 지문, 손글씨, 안면, 음성, DNA 서열 등
[ Examples of Patterns ]
What is Pattern Recognition? 패턴 인식이란?
예를 들어 의학분야에서는 Input 데이터로 영상이미지를 사용하여 분류 결과가 암세포 or 정상세포로 나온다는 것.
[ 필기체 인식 ]
[ 지문 인식 ]
[ 암세포 탐지 ]
[ 차량 번호판 인식 ]
Terminology
용어
Feature
- 데이터 셋의 특성 정보를 담은 변수이다. 작년 ETRI와 진행했던 '모바일 게임 유저로그를 이용한 게임 이탈 예측'을 예로 들어보자.
전체로그에 각 유저의 경험치, 접속일, 게임머니보유량, 이동거리, 플레이시간 등의 항목(특징이 될 만한)이 있고 각 항목이 Feature가 될 수 있다. 전체로그에서 Feature를 추출하여 AI 알고리즘에 넣어주면 게임 이탈 예측을 해주게 되는 것.
Feature space
- 피쳐벡터가 있는 d차원의 공간
- d차원 벡터는 d차원의 공간에서 점을 구성한다.
Class
- 주어진 객체가 속하는 카테고리다. 앞서 예를 들었던 게임 이탈 예측에서의 Class는 이탈과 비이탈이다. 경험치, 접속일 등의 데이터를 받아 AI 알고리즘을 통해 유저가 이탈 Class에 속할지 비이탈 Class에 속할지 분류(Classification)한다.
Pattern
- Class 정보가 잘 레이블링 되고, 신중하게 고려된 feature의 집합
Instance/Exemplar
- 오브젝트에 대해 주어진 예시 패턴
Training Data, Test Data
- AI 를 이용하여 결과를 얻기 위해서는 우선 AI를 Training(훈련, 학습) 시켜야 한다. 이때 쓰는 것이 Training Data이다.
AI가 Training Data를 이용하여 학습한 후 제대로 학습이 되었는지를 Test Data를 이용하여 확인한다. 예를 들어 100G의 데이터 중 70G(training data)는 AI를 학습시키고 남은 30G의 데이터(Test Data)를 AI에 집어 넣어 결과를 얻어내어 학습이 잘 되었는지 확인한다.
Field Test Data
- 어느 Class로 분류할지 알려지지 않은 데이터.
Decision boundary
- 클래스들을 분리해주는 d차원 공간의 경계
Cost Function
- 실제값과 예측값의 차이를 측정
- Classifier이 Cost Function을 최소화 해주는 것
Error
- 데이터를 잘못된 클래스로 분류
Classifier
- Decision boundary를 찾기 위한 알고리즘
Training Performance
- Classifier가 트레이닝 데이터를 기반으로 학습하는 능력
Testing Performance (Generalization)
- Training된 model을 이용하여 결과값이 라벨링되지 않은 Test 데이터를 얼마나 정확하게 라벨링하는지의 능력
'Univ. > Pattern Recognition lecture' 카테고리의 다른 글
사후확률 예제 풀어보기 (0) | 2018.04.24 |
---|---|
확률에 대한 기본 정리 (0) | 2018.04.24 |
Orthogonal / Orthonormal vectors (0) | 2018.04.23 |
N차원 벡터의 곱셈 (0) | 2018.04.21 |
How PR(Pattern Recognition) works? (0) | 2018.03.31 |