일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- kakao
- Community Day
- 스터디 잼
- 해커톤
- 뉴비톤
- SW중심대학
- Tensorflow 2.0
- GDG Campus
- Backend.AI
- 코딩테스트
- Ground Truth
- rl
- entity
- Qwik Start
- 오픈소스해커톤
- API
- SageMaker
- seq2seq
- gcp
- BOAZ
- aws
- CSIP
- OPENHACK
- ainize
- re:Invent
- Speech
- Open Hack
- Conference
- 구글스타트업캠퍼스
- 머신러닝
- Today
- Total
pizzaplanet
Agents 본문
본 강의는 UC Berkeley의 AI 강의를 참고하여 진행됩니다.
Agent는 크게 2가지(Reflex, Flanning) 로 나눌 수 있다.
Reflex agents
- 앞의 수는 고려하지 않고 단지 현재의 상황만을 보고 행동을 취한다.
- 현재 상태에 대한 기억 혹은 모델을 가질 수 있다
- 그렇다면 reflex agent가 합리적일 수 있을까?
Planning agents
- 이렇게 하면 어떤지 끊임없이 물어본다. 이 말은 현재 상황(state)에서 취한 액션이 다음 상황(state')을 어떻게 만들고, 다음 상황
(state')에서 취한 액션이 또 어떤 다다음 상황(state'')을 만드는지 처음부터 끝까지 계획한다.
- 끝까지 계획하기 위해 goal state가 존재해야 한다.
- 완벽한 해(Optimal) vs 단지 해를 찾음(complete) planning로 나뉜다. 예를 들어 서울에서 부산까지 가는 방법은 여러가지다. 국도를 타고 가던 경부고속도로를 타고 가던 속초에 들려 아바이순대를 먹고 가던 서울서 부산까지 가는 길만 찾으면 이것은 complete라고 할 수 있다. 만약 서울에서 부산까지 가장 빠르게 가고싶고, 가장 빠르게 가는 해를 찾았다면 이는 서울-부산 경로의 가장 완벽한 해, 옵티멀한 해를 찾았다고 할 수 있다.
- Planning vs Replanning로 또 나뉜다.
planning는 A to Z를 모두 계획하여 행동한다. 모든 경우의 수를 검토하여 계산하는 시간이 걸리기 때문에 첫 행동 전까지 많은 시간이 소요된다. replanning는 제한된 depth까지만 계획 후 행동하기에 planning 보단 첫 행동이 빠르다.
'Univ. > Artificial intelligence lecture' 카테고리의 다른 글
State Space Graphs vs. Search Trees (0) | 2018.04.15 |
---|---|
Search Problems (0) | 2018.04.05 |
Other places you will meet AI (0) | 2018.04.04 |
What makes an AI problem easy or hard? (0) | 2018.04.04 |
Game agent (0) | 2018.04.04 |