राकुटेन दो साल में खुद को Hadoop निवेश से मुक्त करता है

समस्याओं को खत्म करने के लिए हमारे साधन का प्रयास करें

सैन मेटो, कैलिफ़ोर्निया में स्थित, राकुटेन रिवार्ड्स एक शॉपिंग रिवार्ड कंपनी है जो पूरे वेब पर संबद्ध मार्केटिंग लिंक के माध्यम से पैसा कमाती है। बदले में, सदस्य हर बार पार्टनर रिटेलर के माध्यम से खरीदारी करने पर रिवॉर्ड पॉइंट अर्जित करते हैं और कैश बैक रिवार्ड प्राप्त करते हैं।

स्वाभाविक रूप से यह बहुत सारे उपयोगकर्ता अंतर्दृष्टि डेटा को ड्राइव करता है - कोल्ड स्टोरेज में अधिक के साथ सक्रिय रिकॉल पर सैकड़ों टेराबाइट्स, सटीक होने के लिए।

[ इसके अलावा InfoWorld पर: स्नोफ्लेक समीक्षा: एक डेटा वेयरहाउस को क्लाउड में बेहतर बनाया गया ]

2018 में व्यवसाय ने अधिक उपयोगकर्ताओं को इस अंतर्दृष्टि तक पहुंच प्रदान करने के बारे में गंभीर होना शुरू कर दिया - बिना पायथन या स्काला कोडिंग चॉप के - हार्डवेयर पर अपने पूंजीगत व्यय को कम करते हुए, और क्लाउड को देखना शुरू कर दिया।



'एसक्यूएल सर्वर मशीनें सुरुचिपूर्ण ढंग से स्केल नहीं करती हैं'

पूर्व में एबेट्स के रूप में जाना जाता था, व्यवसाय को 2014 में जापानी ई-कॉमर्स दिग्गज राकुटेन द्वारा अधिग्रहित किया गया था, और तब से तेजी से बढ़ रहा है, जिससे इसके प्रौद्योगिकी स्टैक को आधुनिक बनाने और ग्राहकों को आकर्षित करने और बनाए रखने के तरीके में अधिक डेटा-चालित बनने के लिए मजबूर किया जा रहा है।

इसकी शुरुआत वास्तु से होती है। पिछले तीन वर्षों में राकुटेन रिवार्ड्स ने अपने बड़े डेटा एस्टेट को बड़े पैमाने पर ऑन-प्रिमाइसेस SQL ​​से ऑन-प्रिमाइसेस Hadoop में स्थानांतरित कर दिया है, आज, क्लाउड डेटा वेयरहाउस के सौजन्य से हिमपात का एक खंड .

SQL सर्वर मशीनें सुरुचिपूर्ण ढंग से स्केल नहीं करती हैं, इसलिए हम ईटीएल को चलाने के लिए स्पार्क और पायथन का उपयोग करते हुए क्लाउडेरा के साथ ऑन-प्रिमाइसेस Hadoop गए, और उसमें से कुछ प्रदर्शन प्राप्त किया, मार्क स्टैंज-ट्रेगियर, राकुटेन रिवार्ड्स में एनालिटिक्स के लिए वीपी, ने इन्फोवर्ल्ड को बताया।

उन्होंने कहा कि [Hadoop] संरचना का प्रबंधन तुच्छ और कुछ जटिल नहीं है, इसलिए जब हमने क्लाउड वेयरहाउस को साथ आते देखा तो हमने इस केंद्रीकृत उद्यम-स्तरीय डेटा वेयरहाउस और झील को स्थानांतरित करने का फैसला किया, उन्होंने कहा।

जैसा कि ब्लूमबर्ग के पूर्व डेवलपर और बड़े डेटा सलाहकार मार्क लिटविंट्सचिक ने अपने ब्लॉग पोस्ट में तर्क दिया है क्या हडोप मर चुका है? , 2010 के शुरुआती दिनों के हसीन दिनों के बाद दुनिया Hadoop से आगे बढ़ गई है।

अब, क्लाउड फ्रेमवर्क जो डेटा इंजीनियरिंग टीमों से बहुत अधिक भार उठाते हैं, उन उद्यमों के साथ अधिक लोकप्रिय साबित हो रहे हैं, जो ऑन-प्रिमाइसेस मशीनों के निष्क्रिय रहने की लागत को कम करना चाहते हैं - और समग्र रूप से अपने एनालिटिक्स संचालन को सुव्यवस्थित करने के लिए।

Hadoop से आगे बढ़ना

इसलिए स्टैंज-ट्रेगियर और लीड डेटा इंजीनियर जोजी जॉन ने 2018 के मध्य में अमेज़ॅन वेब सर्विसेज (एडब्ल्यूएस) पब्लिक क्लाउड इंफ्रास्ट्रक्चर के शीर्ष पर स्नोफ्लेक क्लाउड डेटा वेयरहाउस में अपने कोर सिस्टम से एक प्रमुख डेटा माइग्रेशन शुरू करने का फैसला किया।

ईटीएल और वास्तविक डेटा जनरेशन वर्कलोड को स्थानांतरित करने से पहले, रिपोर्टिंग परत और व्यवसाय में कुछ सबसे अधिक उपयोग किए जाने वाले डेटा सेट के साथ माइग्रेशन शुरू हुआ, जो कुछ अधिक संवेदनशील एचआर और क्रेडिट कार्ड की जानकारी को छोड़कर 2019 के अंत तक पूरा हो गया था।

#हडूप #एसक्यूएल #स्नोफ्लेक

www.infoworld.com

राकुटेन दो साल में खुद को Hadoop निवेश से मुक्त करता है

जापानी ई-कॉमर्स दिग्गज की अमेरिकी शाखा हार्डवेयर लागत में कटौती और अपनी संपत्ति के प्रबंधन को आसान बनाने के लिए Hadoop से दूर चली गई है। 2018 में व्यवसाय अधिक उपयोगकर्ताओं को इस अंतर्दृष्टि तक पहुंच प्रदान करने के बारे में गंभीर होने लगा - बिना पायथन के या स्काला कोडिंग चॉप - हार्डवेयर पर अपने पूंजीगत व्यय को कम करते हुए, और क्लाउड को देखना शुरू कर दिया।

यह सभी देखें: