डॉकटर का उपयोग करके पायथन डेटा साइंस कंटेनर का निर्माण कैसे करें

समस्याओं को खत्म करने के लिए हमारे साधन का प्रयास करें

डॉकटर का उपयोग करके पायथन डेटा साइंस कंटेनर का निर्माण कैसे करें

आर्टिफिशियल इंटेलिजेंस (एआई) और मशीन लर्निंग (एमएल) इन दिनों सचमुच आग में हैं। स्व-ड्राइविंग कारों से लेकर नशीली दवाओं की खोज तक और भगवान को पता है कि क्या उपयोग के मामलों की एक विस्तृत स्पेक्ट्रम को शक्ति देना। एआई और एमएल के आगे उनका भविष्य उज्ज्वल और समृद्ध है।

दूसरी ओर, डॉकर ने अल्पकालिक हल्के कंटेनरों की शुरूआत के माध्यम से कंप्यूटिंग की दुनिया में क्रांति ला दी। कंटेनर मूल रूप से डेटा को बनाए रखने के लिए एक गाय (कॉपी ऑन राइट) परत के साथ एक छवि (केवल-पढ़ने के लिए परतों का एक गुच्छा) के अंदर चलाने के लिए आवश्यक सभी सॉफ़्टवेयर को पैकेज करते हैं।

पायथन डेटा साइंस पैकेज

हमारा पायथन डेटा साइंस कंटेनर निम्नलिखित सुपर कूल पायथन पैकेज का उपयोग करता है:



  1. Numpy : NumPy या न्यूमेरिक पायथन बड़े, बहु-आयामी सरणियों और मैट्रिक्स का समर्थन करता है। यह गणितीय और संख्यात्मक दिनचर्या के लिए तेजी से पूर्व-संकलित कार्य प्रदान करता है। इसके अलावा, NumPy बहु-आयामी सरणियों और मैट्रिक्स की कुशल गणना के लिए शक्तिशाली डेटा संरचनाओं के साथ पायथन प्रोग्रामिंग का अनुकूलन करता है।

  2. विज्ञानपी : SciPy प्रतिगमन, न्यूनीकरण, फूरियर-परिवर्तन, और बहुत कुछ के लिए उपयोगी कार्य प्रदान करता है। NumPy के आधार पर, SciPy अपनी क्षमताओं का विस्तार करता है। SciPy की मुख्य डेटा संरचना फिर से एक बहुआयामी सरणी है, जिसे Numpy द्वारा कार्यान्वित किया गया है। पैकेज में ऐसे उपकरण हैं जो रैखिक बीजगणित, संभाव्यता सिद्धांत, अभिन्न कलन और कई अन्य कार्यों को हल करने में मदद करते हैं।

  3. पांडा : पांडा डेटा संरचनाओं में हेरफेर करने और व्यापक डेटा विश्लेषण करने के लिए बहुमुखी और शक्तिशाली उपकरण प्रदान करते हैं। यह अधूरे, असंरचित और अनियंत्रित वास्तविक दुनिया के डेटा के साथ अच्छी तरह से काम करता है - और डेटासेट को आकार देने, एकत्र करने, विश्लेषण करने और विज़ुअलाइज़ करने के लिए टूल के साथ आता है।

  4. साईकिट-लर्न : स्किकिट-लर्न एक पायथन मॉड्यूल है जो मध्यम स्तर पर पर्यवेक्षित और अनुपयोगी समस्याओं के लिए अत्याधुनिक मशीन लर्निंग एल्गोरिदम की एक विस्तृत श्रृंखला को एकीकृत करता है। यह अजगर के लिए सबसे प्रसिद्ध मशीन-लर्निंग पुस्तकालयों में से एक है। स्किकिट-लर्न पैकेज एक सामान्य-उद्देश्य वाली उच्च-स्तरीय भाषा का उपयोग करके गैर-विशेषज्ञों के लिए मशीन लर्निंग लाने पर केंद्रित है। प्राथमिक जोर उपयोग में आसानी, प्रदर्शन, प्रलेखन और एपीआई स्थिरता पर है। सरलीकृत बीएसडी लाइसेंस के तहत न्यूनतम निर्भरता और आसान वितरण के साथ, साईकिट-लर्न का व्यापक रूप से शैक्षणिक और व्यावसायिक सेटिंग्स में उपयोग किया जाता है। स्किकिट-लर्न सामान्य मशीन लर्निंग एल्गोरिदम के लिए एक संक्षिप्त और सुसंगत इंटरफ़ेस को उजागर करता है, जिससे एमएल को उत्पादन प्रणालियों में लाना आसान हो जाता है।

  5. माटप्लोटलिब : Matplotlib एक पायथन 2D प्लॉटिंग लाइब्रेरी है, जो विभिन्न प्रकार के हार्डकॉपी प्रारूपों और प्लेटफार्मों पर इंटरैक्टिव वातावरण में प्रकाशन गुणवत्ता के आंकड़े तैयार करने में सक्षम है। Matplotlib का उपयोग Python लिपियों, Python और IPython शेल, Jupyter नोटबुक, वेब एप्लिकेशन सर्वर और चार ग्राफिकल यूजर इंटरफेस टूलकिट में किया जा सकता है।

  6. एनएलटीके : एनएलटीके मानव भाषा डेटा के साथ काम करने के लिए पायथन कार्यक्रमों के निर्माण के लिए एक अग्रणी मंच है। यह 50 से अधिक कॉर्पोरेट और लेक्सिकल संसाधनों जैसे वर्डनेट के लिए उपयोग में आसान इंटरफेस प्रदान करता है, साथ ही वर्गीकरण, टोकननाइजेशन, स्टेमिंग, टैगिंग, पार्सिंग और सिमेंटिक रीजनिंग के लिए टेक्स्ट प्रोसेसिंग लाइब्रेरी का एक सूट प्रदान करता है।

डेटा साइंस कंटेनर का निर्माण

डेटा वैज्ञानिकों के लिए पायथन तेजी से लोकप्रिय भाषा बन रहा है और इस कारण से हम अपने डेटा साइंस कंटेनर के निर्माण के लिए पायथन को पसंद की भाषा के रूप में उपयोग करने जा रहे हैं।

बेस अल्पाइन लिनक्स छवि

अल्पाइन लिनक्स एक छोटा लिनक्स वितरण है जो बिजली उपयोगकर्ताओं के लिए डिज़ाइन किया गया है जो सुरक्षा, सादगी और संसाधन दक्षता की सराहना करते हैं।

जैसा कि द्वारा दावा किया गया है अल्पाइन :

छोटा। सरल। सुरक्षित। अल्पाइन लिनक्स एक सुरक्षा-उन्मुख, हल्का लिनक्स वितरण है जो musl libc और बिजीबॉक्स पर आधारित है।

अल्पाइन छवि आश्चर्यजनक रूप से छोटी है जिसका आकार कंटेनरों के लिए 8MB से अधिक नहीं है। अंतर्निहित कंटेनर पर हमले की सतह को कम करने के लिए न्यूनतम पैकेज स्थापित किए जाने के साथ। यह अल्पाइन को हमारे डेटा विज्ञान कंटेनर के लिए पसंद की छवि बनाता है।

प्रतिक्रिया बनाम कोणीय 2020

अल्पाइन लिनक्स कंटेनर को डाउनलोड करना और चलाना उतना ही सरल है जितना:

$ docker container run --rm alpine:latest cat /etc/os-release

हमारे Dockerfile में हम केवल अल्पाइन आधार छवि का उपयोग इस प्रकार कर सकते हैं:

FROM alpine:latest

बात सस्ती है चलिए Dockerfile बनाते हैं

अब Dockerfile के माध्यम से अपना काम करते हैं।

FROM निर्देश का उपयोग अल्पाइन: नवीनतम को आधार छवि के रूप में सेट करने के लिए किया जाता है। WORKDIR निर्देश का उपयोग करके हम /var/www को अपने कंटेनर के लिए कार्यशील निर्देशिका के रूप में सेट करते हैं। ENV पैकेज हमारे कंटेनर जैसे git, blas और libgfortran के लिए आवश्यक सॉफ़्टवेयर पैकेजों को सूचीबद्ध करता है। हमारे डेटा साइंस कंटेनर के लिए पायथन पैकेज ENV पैकेज में परिभाषित किए गए हैं।

हमने परतों की संख्या को कम करने के लिए एक ही डॉकरफाइल रन निर्देश के तहत सभी कमांड को जोड़ दिया है जो बदले में परिणामी छवि आकार को कम करने में मदद करता है।

छवि बनाना और टैग करना

अब जब हमारे पास हमारी Dockerfile परिभाषित है, तो टर्मिनल का उपयोग करके Dockerfile के साथ फ़ोल्डर में नेविगेट करें और निम्न कमांड का उपयोग करके छवि बनाएं:

$ docker build -t faizanbashir/python-datascience:2.7 -f Dockerfile .

-t फ्लैग का प्रयोग किसी टैग को 'name:tag' फॉर्मेट में नाम देने के लिए किया जाता है। -f टैग का उपयोग Dockerfile के नाम को परिभाषित करने के लिए किया जाता है (डिफ़ॉल्ट 'PATH/Dockerfile' है)।

कंटेनर चलाना

हमने डॉकर छवि को सफलतापूर्वक बनाया और टैग किया है, अब हम निम्नलिखित कमांड का उपयोग करके कंटेनर चला सकते हैं:

$ docker container run --rm -it faizanbashir/python-datascience:2.7 python

वोइला, हम सभी प्रकार के शांत डेटा विज्ञान सामग्री को करने के लिए तैयार एक अजगर खोल की दृष्टि से स्वागत करते हैं।

Python 2.7.15 (default, Aug 16 2018, 14:17:09) [GCC 6.4.0] on linux2 Type 'help', 'copyright', 'credits' or 'license' for more information. >>>

हमारा कंटेनर पायथन 2.7 के साथ आता है, लेकिन अगर आप पायथन 3.6 के साथ काम करना चाहते हैं तो दुखी न हों। लो, पायथन 3.6 के लिए डॉकरफाइल देखें:

छवि को इस तरह बनाएं और टैग करें:

zsh: आदेश नहीं मिला: mongo
$ docker build -t faizanbashir/python-datascience:3.6 -f Dockerfile .

कंटेनर को इस तरह चलाएं:

$ docker container run --rm -it faizanbashir/python-datascience:3.6 python

इसके साथ, आपके पास सभी प्रकार के कूल डेटा साइंस सामान करने के लिए कंटेनर का उपयोग करने के लिए तैयार है।

पुदीना परोसना'

आंकड़े, आपके पास यह सब सामान स्थापित करने के लिए समय और संसाधन हैं। यदि आप ऐसा नहीं करते हैं, तो आप उन मौजूदा छवियों को खींच सकते हैं जिन्हें मैंने पहले ही बनाया है और डॉकर की रजिस्ट्री में धकेल दिया है डॉकर हब का उपयोग करना:

# For Python 2.7 pull $ docker pull faizanbashir/python-datascience:2.7# For Python 3.6 pull $ docker pull faizanbashir/python-datascience:3.6

छवियों को खींचने के बाद आप छवि का उपयोग कर सकते हैं या इसे अपनी डॉकरफाइल फ़ाइल में बढ़ा सकते हैं या इसे अपने डॉकटर-कंपोज़ या स्टैक फ़ाइल में एक छवि के रूप में उपयोग कर सकते हैं।

परिणाम

AI, ML की दुनिया इन दिनों काफी रोमांचक होती जा रही है और आगे भी रोमांचक होती रहेगी। बड़े खिलाड़ी इन क्षेत्रों में भारी निवेश कर रहे हैं। समय के साथ आप डेटा की शक्ति का उपयोग करना शुरू करते हैं, कौन जानता है कि इससे कुछ अद्भुत हो सकता है।

आप कोड देख सकते हैं यहां .

#पायथन #डॉकर #डेटा-विज्ञान

यह सभी देखें: