Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
Tags
- 백준
- computer vision
- 알고리즘
- reinforcement learning
- 프로그래머스
- Python
- 내용추가
- 모두를 위한 딥러닝
- object detection
- 논문
- coding test
Archives
- Today
- Total
목록reinforcement learning (1)
NISSO
[강화학습] Lec 01 : Introduction
David Silver 교수님의 Reinforcement Learning 강의 정리 https://youtu.be/2pWv7GOvuf0 강의 자료 https://www.davidsilver.uk/teaching/ 한국어 강의 https://youtu.be/wYgyiCEkwC8 (팡요랩) 기계학습은 지도학습, 비지도학습, 강화학습으로 나뉜다. 강화학습은 지도학습, 비지도학습과 다른 개념이란 것이다. * 그림에서 머신러닝은 셋의 교집합이 아니라 가장 큰 원 강화학습의 특징 supervisor 없이 reward만 존재 : 답을 알려주지 않고 보상만 받으면서 좋은 걸 찾아나감 ex) 로봇이 앞으로 가려면 발을 앞으로 내딛어야 한다는 정답을 알려주지 않음. 알아서 액션을 취하고 경험하면서 보상을 받음 피드백이 즉..
ML & DL
2021. 9. 29. 17:40