റീഇൻഫോഴ്സ്മെന്റ് ലേണിംഗ്
ദൃശ്യരൂപം
(മെഷീൻ ലേണിംഗ്/റീഇൻഫോഴ്സ്മെന്റ് ലേണിംഗ് എന്ന താളിൽ നിന്നും തിരിച്ചുവിട്ടതു പ്രകാരം)
റീഇൻഫോഴ്സ്മെന്റ് ലേണിംഗിൽ ഒരു ഏജൻറ് (agent) പരിസ്ഥിതിയുമായി സംവദിച്ച് റിവാർഡ് നേടി പഠിക്കുന്നു. ലക്ഷ്യം: ഏറ്റവും നല്ല തീരുമാനങ്ങൾ എടുക്കുക.
പ്രധാന ആശയങ്ങൾ
[തിരുത്തുക]- ഏജൻറ് (Agent)
- പരിസ്ഥിതി (Environment)
- റിവാർഡ് (Reward)
- ആക്ഷൻ (Action)
- നയം (Policy)
ഉപയോഗം
[തിരുത്തുക]- ഗെയിമുകൾ (Game playing, e.g., Chess, Go)
- സ്വയം പ്രവർത്തിക്കുന്ന വാഹനങ്ങൾ
- റോബോട്ടിക്സ്
പ്രശസ്തമായ അൽഗോരിതങ്ങൾ
[തിരുത്തുക]- Q-learning
- Deep Q Network (DQN)
- Policy Gradient Methods