"ରିଏନ୍ଫୋର୍ସମେଣ୍ଟ ଲର୍ଣ୍ଣିଙ୍ଗ୍" ପୃଷ୍ଠାର ସଂସ୍କରଣଗୁଡ଼ିକ ମଧ୍ୟରେ ତଫାତ
Content deleted Content added
Soumendrak (ଆଲୋଚନା | ଅବଦାନ) ଟିକେ Soumendrak ପୃଷ୍ଠାଟିକୁ ରିଏନଫୋର୍ସମେଣ୍ଟ ଲର୍ଣିଂରୁ ରିଏନ୍ଫୋର୍ସମେଣ୍ଟ ଲର୍ଣିଂକୁ ଘୁଞ୍ଚାଇଲେ: ଭୁଲ ବନାନ ଥିଲା ଠିକ କରାଗଲା |
Soumendrak (ଆଲୋଚନା | ଅବଦାନ) ଛାଞ୍ଚ ଯୋଗ ହେଲା ଟ୍ୟାଗ: 2017 source edit |
||
୧ କ ଧାଡ଼ି:
{{ମେସିନ ଲର୍ଣିଂ}}
ଏହା ହେଉଛି [[ମେସିନ ଲର୍ଣିଂ]]<nowiki/>ର ଏକ ବିଭାଗ ଯେଉଁଥିରେ କିପରି ଏକ ସଫ୍ଟୱେର ଏଜେଣ୍ଟ ଏକ ନିର୍ଦ୍ଧିଷ୍ଟ ପରିବେଶରେ ନିଷ୍ପତ୍ତି ନେଇ ଅଧିକ ଲାଭ ଉଠେଇପାରିବ ସେ ବିଷୟରେ ଗବେଷଣା ଓ ଆଲୋଚନା ହୋଇଥାଏ ।<ref>http://reinforcementlearning.ai-depot.com/</ref><ref>https://top.quora.com/What-is-reinforcement-learning</ref> ଏହାର ସାଧାରଣତା ନିମିତ୍ତ ଏହି ବିଷୟାଟିକୁ ଆହୁରି ଅନେକ ସ୍ଥାନରେ ମଧ୍ୟ ପ୍ରୟୋଗ କରାଯାଇଥାଏ ଯେପରିକି [[ଗେମ ଥିଓରୀ]], କଣ୍ଟ୍ରୋଲ ଥିଓରୀ, ଇନଫର୍ମେଶନ ଥିଓରୀ ଇତ୍ୟାଦି ।
|