"ରିଏନ୍ଫୋର୍ସମେଣ୍ଟ ଲର୍ଣ୍ଣିଙ୍ଗ୍" ପୃଷ୍ଠାର ସଂସ୍କରଣ‌ଗୁଡ଼ିକ ମଧ୍ୟରେ ତଫାତ

Content deleted Content added
ଛାଞ୍ଚ ଯୋଗ ହେଲା
ଟ୍ୟାଗ: 2017 source edit
ଘଟଣାବଳୀ ବିଷୟରେ ଲେଖାହେଲା
୧ କ ଧାଡ଼ି:
{{ମେସିନ ଲର୍ଣିଂ}}
ଏହା ହେଉଛି [[ମେସିନ ଲର୍ଣିଂ]]<nowiki/>ର ଏକ ବିଭାଗ ଯେଉଁଥିରେ କିପରି ଏକ ସଫ୍ଟୱେର ଏଜେଣ୍ଟ ଏକ ନିର୍ଦ୍ଧିଷ୍ଟ ପରିବେଶରେ ନିଷ୍ପତ୍ତି ନେଇ ଅଧିକ ଲାଭ ଉଠେଇପାରିବ ସେ ବିଷୟରେ ଗବେଷଣା ଓ ଆଲୋଚନା ହୋଇଥାଏ ।<ref>http://reinforcementlearning.ai-depot.com/</ref><ref>https://top.quora.com/What-is-reinforcement-learning</ref> ଏହାର ସାଧାରଣତା ନିମିତ୍ତ ଏହି ବିଷୟାଟିକୁ ଆହୁରି ଅନେକ ସ୍ଥାନରେ ମଧ୍ୟ ପ୍ରୟୋଗ କରାଯାଇଥାଏ ଯେପରିକି [[ଗେମ ଥିଓରୀ]], କଣ୍ଟ୍ରୋଲ ଥିଓରୀ, ଇନଫର୍ମେଶନ ଥିଓରୀ ଇତ୍ୟାଦି ।
 
[[ସୁପରଭାଇଜଡ଼ ଲର୍ଣିଂ]] ପରି ରିଏନ୍ଫୋର୍ସମେଣ୍ଟ ଲର୍ଣିଂ ନିମିତ୍ତ ଚିନ୍ହିତ ତଥ୍ୟ ଆବଶ୍ୟକ ନୁହେଁ । ଚିନ୍ହିତ ତଥ୍ୟର ଅନୁପସ୍ଥିତିରେ ଏଜେଣ୍ଟଟି ନିଜର ଅଭିଜ୍ଞାତାରୁ ଶିକ୍ଷ୍ୟାଲାଭ କରିଥାଏ । ଶିଖିବା ସମୟରେ କେଉଁ ନିଷ୍ପତି ଭଲ ଏବଂ କେଉଁଟି ଖରାପ ଏହା ମନେରଖି ଦୂରଦୃଷ୍ଟିରେ କେଉଁ ନିଷ୍ପତିଟି ଭଲ ହେବ ସେହି ନିଷ୍ପତି ନେବାକୁ ଚେଷ୍ଟା କରିଥାଏ ।<ref>https://medium.com/machine-learning-for-humans/reinforcement-learning-6eacf258b265</ref>
 
== ଘଟଣାବଳୀ ==
 
* ଗୁଗଲ ସର୍ବସାଧାରଣ ଲୋକମାନଙ୍କ ନିମିତ୍ତ ଏହାର ନିଜର ରିଏନ୍ଫୋର୍ସମେଣ୍ଟ ଫ୍ରେମବାର୍କକୁ ପ୍ରକାଶ କରିଛି ।<ref>https://venturebeat.com/2018/08/27/google-releases-open-source-reinforcement-learning-framework-for-training-ai-models/</ref> ଏହାର ଗିଟହବ ଆଧାର [https://github.com/google/dopamine/tree/master/docs#downloads ଏଠାରେ] ଉପଲବ୍ଧ ।
 
== ଅଧାର ==