यन्त्रशिक्षणम्
Geoffrey Hinton | |
---|---|
जन्म |
6 December 1947 Wimbledon, London, England |
पुरस्काराः | AAAI Fellow (1990) Rumelhart Prize (2001) IJCAI Award for Research Excellence (2005) IEEE Frank Rosenblatt Award (2014) James Clerk Maxwell Medal (2016) |
यन्त्रशिक्षणम्
यन्त्रशिक्षणं कृत्रिमबुद्धेः अनुप्रयोगः अस्ति यत्र सङ्गणकः/यन्त्रः पूर्वानुभवात् (इनपुट्-दत्तांशः) शिक्षते, भविष्यस्य भविष्यवाणीं च करोति । एतादृशस्य व्यवस्थायाः कार्यप्रदर्शनं न्यूनातिन्यूनं मानवीयस्तरं भवेत् ।
मशीन लर्निंग श्रेणियाँ यन्त्रशिक्षणं सामान्यतया त्रयः प्रकारेषु वर्गीकृतं भवति : पर्यवेक्षितशिक्षणम्, अनिरीक्षितशिक्षणम्, सुदृढीकरणशिक्षणम् पर्यवेक्षितशिक्षणम् : १. पर्यवेक्षितशिक्षणे यन्त्रं प्रत्येकस्य उदाहरणस्य लेबलैः लक्ष्यैः सह उदाहरणानि अनुभवति । दत्तांशेषु लेबल्-स्थानानि अल्गोरिदम्-इत्यस्य विशेषतानां सहसंबन्धं कर्तुं साहाय्यं कुर्वन्ति ।
पर्यवेक्षितयन्त्रशिक्षणकार्ययोः द्वौ सामान्यौ वर्गीकरणं प्रतिगमनं च ।
अनिरीक्षितशिक्षणम् : १. यदा अस्माकं कृते अवर्गीकृतं अलेबलं च दत्तांशं भवति तदा प्रणाली दत्तांशतः प्रतिमानं उद्घाटयितुं प्रयतते . उदाहरणानां कृते लेबलं लक्ष्यं वा न दत्तम् । एकं सामान्यं कार्यं भवति यत् समानानि उदाहरणानि एकत्र समूहीकृत्य clustering इति ।
सुदृढीकरणशिक्षणम् : १. सुदृढीकरणशिक्षणं लक्ष्य-उन्मुख-अल्गोरिदम्-इत्येतत् निर्दिशति, ये जटिल-उद्देश्यं (लक्ष्यं) कथं प्राप्तुं वा अनेक-पदेषु कस्यचित् विशेष-आयामस्य अधिकतमं कर्तुं वा शिक्षन्ति एषा पद्धतिः यन्त्राणां सॉफ्टवेयर-एजेण्टानां च स्वयमेव विशिष्टसन्दर्भे आदर्शव्यवहारस्य निर्धारणं कर्तुं शक्नोति यत् तस्य कार्यक्षमतां अधिकतमं कर्तुं शक्नोति । एजेण्टस्य कृते सरलपुरस्कारप्रतिक्रिया आवश्यकी भवति यत् सः ज्ञातुं शक्नोति यत् कोऽपि क्रिया सर्वोत्तमः अस्ति; एतत् सुदृढीकरणसंकेतं इति ज्ञायते । यथा, अनेकेषु चालनेषु क्रीडायां जितानां अंकानाम् अधिकतमं करणीयम् ।
पर्यवेक्षितयन्त्रशिक्षणस्य तकनीकाः प्रतिगमनं प्रतिक्रिया (आश्रितस्य) चरस्य मूल्यस्य पूर्वानुमानार्थं प्रयुक्ता तकनीकः अस्ति, एकस्मात् वा अधिकेभ्यः पूर्वानुमानकेभ्यः (स्वतन्त्रेभ्यः) चरेभ्यः ।
सर्वाधिकं प्रयुक्ताः प्रतिगमनप्रविधयः सन्ति : रेखीयप्रतिगमनं तथा लॉजिस्टिकप्रतिगमनम् । अन्येषां बहूनां मुख्यसंकल्पनानां व्याख्यानस्य पार्श्वे एतयोः प्रमुखयोः तकनीकयोः पृष्ठतः सिद्धान्तस्य चर्चां करिष्यामः
व्यय कार्यम् वयं रेखीयप्रतिगमनस्य कृते यत् मूल्यकार्यं प्रयुक्तवन्तः तत् एव मूल्यकार्यं उपयोक्तुं न शक्नुमः यतोहि सिग्मोइड फंक्शन इत्यनेन आउटपुट् लहरितं भविष्यति, येन बहवः स्थानीयाः ऑप्टिमाः भवन्ति । अन्येषु शब्देषु उत्तलकार्यं न भविष्यति । मूल्यकार्यं उत्तलं भवति इति सुनिश्चित्य (अतः वैश्विकन्यूनतमपर्यन्तं अभिसरणं सुनिश्चित्य) सिग्मोइडफलनस्य लघुगणकस्य उपयोगेन मूल्यकार्यं परिवर्तितं भवति
अण्डर-फिटिंग & ओवर-फिटिंग वयं मॉडल् क्षमतां वर्धयित्वा न्यूनीकृत्य वा यन्त्रशिक्षण-एल्गोरिदम् इनपुट्-दत्तांशस्य अनुरूपं कर्तुं प्रयत्नशीलाः स्मः । रेखीयप्रतिगमनसमस्यासु वयं बहुपदानां डिग्रीम् वर्धयामः न्यूनीकरोमः वा ।
अण्डर-फिटिंग् : १. यदा मॉडले न्यूनानि विशेषतानि सन्ति अतः दत्तांशतः बहु सम्यक् शिक्षितुं न शक्नोति। अस्मिन् प्रतिरूपे उच्चः पूर्वाग्रहः अस्ति ।
अति-फिटिंग् : १. यदा आदर्शस्य जटिलकार्यं भवति अतः दत्तांशं बहु सम्यक् समायोजयितुं समर्थः परन्तु नूतनदत्तांशस्य पूर्वानुमानं कर्तुं सामान्यीकरणं कर्तुं समर्थः नास्ति । अस्य प्रतिरूपस्य उच्चविचरणं भवति ।
अति-फिटिंग् इत्यस्य विषयस्य सम्बोधनाय मुख्यतया त्रयः विकल्पाः सन्ति- १.
विशेषतानां संख्यां न्यूनीकरोतु: के विशेषताः स्थापयितव्याः इति मैन्युअल् रूपेण चिनोतु। एवं कुर्वन्तः वयं काश्चन महत्त्वपूर्णाः सूचनाः
चूकितुं शक्नुमः, यदि वयं केचन विशेषताः क्षिपामः ।
नियमितीकरणं : सर्वाणि विशेषतानि स्थापयन्तु, परन्तु भारस्य परिमाणं न्यूनीकरोतु . नियमितीकरणं तदा सम्यक् कार्यं करोति यदा अस्माकं समीपे किञ्चित् उपयोगी विशेषता बहु भवति। प्रारम्भिकं स्थगनम् : यदा वयं ग्रेडिएण्ट् डिसेण्ट् इत्यस्य उपयोगः इत्यादिकं शिक्षण-एल्गोरिदम् पुनरावर्तनीयरूपेण प्रशिक्षयामः तदा वयं मॉडलस्य प्रत्येकं पुनरावृत्तिः कियत् उत्तमं कार्यं करोति इति मापनं कर्तुं शक्नुमः । निश्चितसङ्ख्यायाः पुनरावृत्तयः यावत् प्रत्येकं पुनरावृत्तिः प्रतिरूपस्य उन्नतिं करोति । परन्तु तदनन्तरं प्रशिक्षणदत्तांशस्य अति-अनुरूपतां प्रारभते इति कारणेन आदर्शस्य सामान्यीकरणक्षमता दुर्बलतां प्राप्तुं शक्नोति । नियमितीकरण गुणांकानाम् अथवा भारानाम् बृहत् मूल्यं प्राप्तुं निरुत्साहं कर्तुं त्रुटिकार्यं प्रति दण्डपदं योजयित्वा रेखीय तथा लॉजिस्टिक प्रतिगमनयोः कृते नियमितीकरणं प्रयोक्तुं शक्यते
अति-पैरामीटर् अति-मापदण्डाः “उच्चस्तरीयाः” मापदण्डाः सन्ति ये एकस्य प्रतिरूपस्य विषये संरचनात्मकसूचनाः वर्णयन्ति यत् आदर्शमापदण्डान् फिट् कर्तुं पूर्वं निर्णयः करणीयः, अति-मापदण्डानां उदाहरणानि येषां चर्चा अस्माभिः अद्यावधि कृता: शिक्षण दर अल्फा, नियमितीकरण लम्बदा ।
पार-मान्यता अति-मापदण्डानां इष्टतममूल्यानां चयनस्य प्रक्रिया मॉडलचयनम् इति कथ्यते । यदि वयं मॉडलचयनस्य समये एकमेव परीक्षणदत्तांशसमूहं पुनः पुनः उपयुञ्ज्महे तर्हि अस्माकं प्रशिक्षणदत्तांशस्य भागः भविष्यति तथा च मॉडलस्य अतियोग्यतायाः अधिका सम्भावना भविष्यति
समग्रदत्तांशसमूहः निम्नलिखितरूपेण विभक्तः अस्ति :
प्रशिक्षणदत्तांशसमूहः सत्यापनदत्तांशसमूहः परीक्षणदत्तांशसमूहः।
सम्बद्धाः लेखाः
[सम्पादयतु]सन्दर्भः https://mitsloan.mit.edu/ideas-made-to-matter/machine-learning-explained https://www.sas.com/en_us/insights/analytics/machine-learning.html