Google डेटा विज्ञान साक्षात्कार के प्रश्न: आपको इसे क्रैक करने के लिए सभी जानना होगा

यह आलेख आपको Google डेटा विज्ञान साक्षात्कार क्वेस्ट, साक्षात्कार प्रक्रिया और Google में नौकरी के लिए आवेदन करने के लिए आवश्यक शर्तें प्रदान करता है।

Google जैसी वैश्विक रूप से नामी कंपनी में काम पर रखना बहुत सारे लोगों के लिए एक ड्रीम जॉब है। उनके पास सबसे प्रतिभाशाली एआई शोध वैज्ञानिक हैं, तथा दुनिया में। Google के लिए कई स्रोत नहीं हैं इंटरव्यू के सवाल ऑनलाइन और वहां नौकरी पाना आसान नहीं है। इसलिए, मैं इस लेख में निम्नलिखित विषयों को शामिल करूंगा:

नौकरी का विवरण और आवश्यकताएँ

के औसत वेतन के साथ $ 169,067 , बोनस सहित। Google डेटा साइंटिस्ट की सैलरी से लेकर $ 120,000 - $ 280,000 । इस उच्च वेतन के साथ, आपको उस नौकरी की सही आवश्यकताओं को जानना होगा जो आप आवेदन कर रहे हैं। हालाँकि आवश्यकताएँ स्थिति से स्थिति में भिन्न होती हैं, नीचे कुछ सामान्य हैं:

न्यूनतम जरूरत:





अमूर्त वर्ग और इंटरफ़ेस के बीच अंतर

google

  • मात्रात्मक अनुशासन में मास्टर डिग्री (सांख्यिकी, संचालन अनुसंधान, कंप्यूटर विज्ञान)
  • डेटा विश्लेषण संबंधित क्षेत्र में 2 साल का कार्य अनुभव
  • सांख्यिकीय सॉफ्टवेयर के साथ अनुभव (जैसे, आर , , MATLAB, पंडों) और
  • डेटाबेस भाषाओं के साथ अनुभव (जैसे, एसक्यूएल )

जिम्मेदारियां:



मर्ज सॉर्ट c ++ सोर्स कोड
  • बड़े, जटिल डेटा सेट के साथ काम करें। मुश्किल, गैर-नियमित विश्लेषण समस्याओं को हल करें, आवश्यकतानुसार उन्नत विश्लेषणात्मक तरीकों को लागू करें
  • आचरण विश्लेषण जिसमें डेटा एकत्र करना और आवश्यकताएं शामिल हैं विनिर्देशन, प्रसंस्करण, विश्लेषण, चल रहे डिलिवरेबल्स, और प्रस्तुतिकरण
  • निर्माण और प्रोटोटाइप विश्लेषण पाइपलाइनों पैमाने पर अंतर्दृष्टि प्रदान करने के लिए पुनरावृति
  • Google डेटा संरचनाओं और मैट्रिक्स का व्यापक ज्ञान विकसित करें, जहां उत्पाद विकास के लिए आवश्यक परिवर्तनों की वकालत करें
  • क्रॉस-फंक्शनलली इंटरैक्ट करें, व्यावसायिक सिफारिशें करें (जैसे, लागत-लाभ, पूर्वानुमान, प्रयोग विश्लेषण)
  • Google के उपयोगकर्ता-सामना करने वाले उत्पादों की गुणवत्ता में सुधार के लिए विश्लेषण, पूर्वानुमान और अनुकूलन के तरीकों का अनुसंधान और विकास करना

Google डेटा विज्ञान साक्षात्कार प्रक्रिया

शॉर्टलिस्ट को साफ़ करना अपने आप में एक कठिन काम है, जो पूरी तरह से आपके ऊपर निर्भर करता है सीवी, कवर लेटर और यह अनुभव । गूगल डाटा साइंस साक्षात्कार प्रश्न ब्रेन टीज़र और तकनीकी क्वेरी का मिश्रण है। आमतौर पर, पहली प्रक्रिया टेलिफोनिक साक्षात्कार है।

टेलिफोनिक साक्षात्कार:

इसमें ज्यादातर प्रश्न आधारित होते हैं (ठोस और सैद्धांतिक) और काफी हद तक आधारित है । आपके द्वारा काम की गई परियोजनाओं के आधार पर प्रश्न भी भिन्न होते हैं।
  • मामला एक: साक्षात्कार में फीचर निष्कर्षण तकनीक, पीसीए (प्रोजेक्ट्स में प्रयुक्त), सहसंबंध विश्लेषण, कुछ वर्गीकरण तकनीकों का उपयोग किया गया था (एसवीएम, जीबीएम, तंत्रिका जाल) के बारे में पूछा था। लॉजिस्टिक रिग्रेशन क्यों नहीं, जीबीएम क्यों? - मूल रूप से वर्ग पृथक्करण के आसपास घूमने वाले प्रश्न।
  • केस 2: फ़ीचर चयन का उपयोग क्यों करें? यदि दो भविष्यवाणियों को अत्यधिक सहसंबद्ध किया जाता है, तो लॉजिस्टिक रिग्रेशन में गुणांक पर क्या प्रभाव पड़ता है? गुणांक के आत्मविश्वास अंतराल क्या हैं?
  • केस 3: एक स्पिंडल पर एक डिस्क घूम रही है और आप उस दिशा को नहीं जानते हैं जिस तरह से डिस्क घूम रही है। आपको पिन के एक सेट के साथ प्रदान किया जाता है। आप यह बताने के लिए कि डिस्क कताई किस तरह से पिन का उपयोग करेगी?
टेलिफोनिक साक्षात्कार के बाद, यह फेस टू फेस और कोडिंग राउंड है। तो, चलिए चर्चा करते हैं कुछ सबसे सामान्य Google डेटा विज्ञान साक्षात्कार प्रश्न। हालाँकि ये प्रश्न नीचे दिए गए तरीके से नहीं पूछे जा सकते हैं, लेकिन मैंने इनमें से कई को कवर करने की कोशिश की है।

Google डेटा विज्ञान साक्षात्कार प्रश्न

ये प्रश्न गूढ़ नहीं हैं, क्योंकि Google ने इसके बजाय उन प्रश्नों को पूछना बंद कर दिया है, उनके समान प्रश्न हैं, जिन्हें वे कहते हैं समस्या-समाधान प्रश्न । मशीन लर्निंग के बहुत सारे सवाल, जेनेरिक से लेकर प्रैक्टिकल तक सभी पूछे जाते हैं। गूगल मूल रूप से गहराई के बजाय विषयों की चौड़ाई को कवर करता है। Q1। आप एक कैसीनो में हैं और आपके पास खेलने के लिए दो पांसे हैं। हर बार जब आप जीतते हैं तो आप $ 10 जीतते हैं। यदि आप जीत तक खेलते हैं और फिर रुक जाते हैं, तो अपेक्षित भुगतान क्या है? Q2। आप लंदन जाने वाले हैं, आप जानना चाहते हैं कि आपको छाता लाना है या नहीं। यदि आप बारिश हो रही हो तो आप अपने तीन यादृच्छिक मित्रों और उनमें से प्रत्येक को बुलाते हैं। आपके मित्र द्वारा सच कहे जाने की संभावना 2/3 है और यह संभावना कि वे झूठ बोलकर आप पर प्रैंक खेल रहे हैं, 1/3 है। यदि उनमें से सभी 3 बताते हैं कि बारिश हो रही है, तो क्या संभावना है कि यह वास्तव में लंदन में बारिश हो रही है। Q3। नया कैसे जोड़ेगा फेसबुक सदस्यों के डेटाबेस में सदस्य, और डेटाबेस में दूसरों के लिए अपने संबंधों को कोड करते हैं? Q4। आप यह कैसे परखेंगे कि 6 महीने के बाद किसी उपयोगकर्ता के सक्रिय रहने की संभावना बढ़ जाती है, क्योंकि उपयोगकर्ता के पास अब अधिक दोस्त हैं? क्यू 5। आपको चार अलग-अलग रंगों के साथ 40 कार्ड दिए जाते हैं- 10 ग्रीन कार्ड, 10 रेड कार्ड, 10 ब्लू कार्ड और 10 येलो कार्ड। प्रत्येक रंग के कार्ड एक से दस तक गिने जाते हैं। दो कार्ड यादृच्छिक पर चुने गए हैं। इस संभावना को जानें कि जो कार्ड उठाए गए हैं वे समान संख्या और समान रंग के नहीं हैं। Q6। विभिन्न ट्वीट्स के साथ एक टेक्स्ट फ़ाइल पढ़ने के लिए अपनी पसंद की भाषा में एक कार्यक्रम बनाएं। आउटपुट में 2 टेक्स्ट फाइल्स-एक होनी चाहिए जिसमें बार-बार शब्दों के लिए गिनती के साथ सभी ट्वीट्स के बीच सभी अनूठे शब्दों की सूची शामिल हो और दूसरी फाइल में सभी ट्वीट्स के लिए अद्वितीय शब्दों की मध्यम संख्या होनी चाहिए। प्र 7। यदि किसी डेटासेट के कारण पूर्वाग्रह से गायब मूल्यों को हटा दिया जाए तो आप क्या करेंगे? प्रश्न 8। एक स्पिंडल पर एक डिस्क घूम रही है और आप उस दिशा को नहीं जानते हैं जिस तरह से डिस्क घूम रही है। आपको पिन के एक सेट के साथ प्रदान किया जाता है। आप यह बताने के लिए कि डिस्क कताई किस तरह से पिन का उपयोग करेगी? क्यू 9। आप नौकरियों के लिए एक सिफारिश इंजन कैसे डिजाइन करेंगे? प्रश्न 10। Google पर आप किस प्रकार का उत्पाद बनाना चाहते हैं? प्रश्न 11। कारों को स्पीड ट्रैकर के साथ प्रत्यारोपित किया जाता है ताकि बीमा कंपनियां हमारे ड्राइविंग राज्य के बारे में पता लगा सकें। इस नई योजना के आधार पर किस तरह के व्यावसायिक प्रश्नों का उत्तर दिया जा सकता है? प्रश्न 12। आप कैसे तय कर सकते हैं कि एक एल्गोरिथ्म दूसरे की तुलना में बेहतर है? प्रश्न 13। एक बॉक्स में 12 रेड कार्ड और 12 ब्लैक कार्ड होते हैं। एक अन्य बॉक्स में 24 रेड कार्ड और 24 ब्लैक कार्ड हैं। आप दो बक्से में से एक से यादृच्छिक पर दो कार्ड निकालना चाहते हैं, किस बॉक्स में एक ही रंग के कार्ड प्राप्त करने की अधिक संभावना है और क्यों? प्रश्न 14। बैगेड मॉडल और बूस्टेड मॉडल में क्या अंतर है? प्र 15। आप हर महीने उपयोगकर्ता सामग्री अपलोड के लिए एक रिपोर्ट बना रहे हैं और जनवरी के महीने के लिए अपलोड की संख्या में अचानक वृद्धि का निरीक्षण करते हैं। अपलोड में वृद्धि, विशेष रूप से छवि अपलोड में है। आपको क्या लगता है इसका कारण क्या होगा और आप इस अचानक स्पाइक का परीक्षण कैसे करेंगे? प्रश्न 16। आप एक कपड़े के उद्यम के मालिक हैं और बाजार में अपनी जगह सुधारना चाहते हैं। आप इसे जमीनी स्तर से कैसे करेंगे? प्रश्न 17। आप कैसे तय करेंगे कि सर्ज प्राइसिंग एल्गोरिदम के दो संस्करणों में से कौन सा संस्करण किसी विमानन कंपनी के लिए बेहतर काम कर रहा है? प्रश्न 18। लसो के लिए स्वतंत्रता की डिग्री क्या है? प्रश्न 19। पायथन में एक इट्रेटर, जनरेटर और सूची समझ के बीच अंतर क्या है? प्रश्न 20। वेबसाइट पर वेबपृष्ठों और परिवर्तनों के एक सेट को देखते हुए, आप यह निर्धारित करने के लिए नई वेबसाइट सुविधा का परीक्षण कैसे करेंगे कि क्या परिवर्तन सकारात्मक रूप से काम करता है? प्रश्न 21। एक वर्णमाला वाले प्रत्येक सेल के साथ एक MxN आयाम मैट्रिक्स को देखते हुए, पता लगाएं कि क्या एक स्ट्रिंग इसमें निहित है या नहीं। प्रश्न 22। आप हैशमैप जैसी उन्नत डेटा संरचना का उपयोग करके कैशिंग सिस्टम का निर्माण कैसे करेंगे? प्र 23। यदि आप संग्रह विधियों या संसाधनों की परवाह किए बिना किसी भी विषय पर डेटासेट प्राप्त कर सकते हैं, तो डेटासेट कैसा दिखेगा और आप इसके साथ क्या करेंगे? प्रश्न 24। विसंगति का पता लगाने के तरीके क्या हैं? प्रश्न 25। डेटा साइंस में कैशिंग कैसे काम करता है और आप इसका उपयोग कैसे करते हैं? तो दोस्तों, इसके साथ हम इस लेख को समाप्त करते हैं। Google डेटा विज्ञान साक्षात्कार प्रश्न अधिकतर हैं परिदृश्य आधारित और आप की आवश्यकता है समस्या सुलझाने की क्षमता और इसके अलावा आपको यह जानना होगा कि इन स्थितियों के लिए डेटा साइंस कैसे लागू किया जाए। मुझे उम्मीद है कि यह आपको भविष्य में किसी भी डेटा साइंस साक्षात्कार के लिए तैयार होने का एक परिप्रेक्ष्य देगा। यह Google, Microsoft, Apple या Uber बनें। सभी टेक दिग्गज इसी तरह के सवाल पूछते हैं जब यह डेटा साइंस में आता है क्योंकि यह एक विशाल और एक ही समय में एक नया क्षेत्र है। आपको डेटा साइंस प्रोफेशनल्स द्वारा उपयोग किए जाने वाले टूल और सिस्टम में कुशल बनाता है। इसमें सांख्यिकी, डेटा विज्ञान, पायथन, अपाचे स्पार्क और स्काला, टेन्सरफ्लो और झांकी पर प्रशिक्षण शामिल है। पाठ्यक्रम दुनिया भर में 5000 + नौकरी के विवरण पर व्यापक शोध द्वारा निर्धारित किया गया है। यदि आपके कोई प्रश्न हैं, तो नीचे टिप्पणी अनुभाग में उल्लेख करने के लिए स्वतंत्र महसूस करें।