Lesson 15: Speech Recognition

Lesson Description

स्पीच रिकग्निशन कैसे काम करती है और व्याखान को टेक्स्ट में बदलने के लिए पिक्टोब्लॉक्स में AI ब्लॉक का उपयोग करती है। पिक्टोब्लॉक्स में एक वर्चुअल असिस्टेंट बनाना जो एक आदेश को पहचान सकता है और अनुरोधित गीत चला सकता है।f

Speech Recognition

स्पीच रिकग्निशन एक मशीन की बोली जाने वाली भाषा में शब्दों और वाक्यांशों की पहचान करने और उन्हें मशीन-पठनीय प्रारूप में बदलने की क्षमता है।

मनुष्य एक भाषा कैसे सीखते हैं?

जब से हम पैदा होते हैं, तब से हम अपने चारों ओर शब्दों और ध्वनियों को सुनते हैं। बोलने से पहले ही हमें कुछ ऐसे शब्द सुनाई देने लगते हैं कि हम मम्मा, दादा, हां और ना जैसे शब्दों का जवाब देने लगते हैं।

हमारा मस्तिष्क विभिन्न ध्वनियों और शब्दों में अंतर करने और उन्हें वर्गीकृत (categorize) करने के लिए पैटर्न खोजने की कोशिश करता है। ऐसा लग सकता है कि इंसान सुनने और समझने के लिए प्री-प्रोग्राम्ड है लेकिन ऐसा नहीं है। हमें इस क्षमता को विकसित करने के लिए प्रशिक्षित किया गया है।

स्पीच रिकग्निशन तकनीक को उसी ढंग पर विकसित किया गया है। कंप्यूटर को भी इसी तरह ट्रैन किया जाता है।

Alexa कैसे काम करती है?

अमेज़ॅन की वर्चुअल असिस्टेंट (virtual assistant) AI तकनीक, Alexa, बोली जाने वाली भाषा को सुनने योग्य ध्वनियों, शब्दों और अवधारणाओं (concepts) में बदलने के लिए Natural Language Processing को नियोजित करती है। यह ऐसे काम करता है:

  1. Alexa सबसे पहले आपकी स्पीच रिकॉर्ड करती है । फिर, यह रिकॉर्डिंग अमेज़ॅन के सर्वरों को अधिक कुशलता से एनालाइज (analyze) करने के लिए भेजी जाती है।
  2. अमेज़ॅन रिकॉर्डिंग को अलग-अलग ध्वनियों में तोड़ देता है। इसके बाद यह विभिन्न शब्दों के उच्चारण वाले एक डेटाबेस से कंसल्ट करता है ताकि यह पता लगाया जा सके कि कौन से शब्द अलग-अलग ध्वनियों के कॉम्बिनेशन से सबसे अधिक मेल खाते हैं।
  3. इसके बाद यह कार्यों की समझ बनाने और संबंधित कार्यों को पूरा करने के लिए खोजशब्दों की पहचान करता है। उदाहरण के लिए, यदि एलेक्सा “मौसम” या “तापमान” जैसे शब्दों को नोटिस करता है, तो यह मौसम ऐप खोल देगा।
  4. अमेज़ॅन के सर्वर आपके डिवाइस पर जानकारी वापस भेजते हैं। अगर Alexa को आपसे कुछ भी कहने की जरूरत है, तो यह ऊपर वर्णित उसी प्रक्रिया से गुजरेगा, लेकिन विपरीत क्रम में।

Activity 1: Make Your Own Alexa!

इस प्रोजेक्ट में हम Alexa की तरह अपना AI पर्सनल असिस्टेंट बनाएंगे। हम एक ऐसी स्क्रिप्ट बनाएंगे जो हमारे वॉयस कमांड को पहचान लेगी और मारियो थीम गीत या स्पाइडर-मैन थीम गीत चलाने के लिए इसका विश्लेषण (recognize) करेगी। यदि कमांड की पहचान नहीं हो पाती है, तो वह कहेगा कि उसे कमांड समझ में नहीं आया।

Coding Steps

नीचे दिए गए स्टेप्स का पालन करें:

  1. निम्न लिंक पर क्लिक करें ( https://bit.ly/ALEXASPEECH ) और पिक्टोब्लॉक्स फ़ाइल खोलें।
  2. टोबी स्प्राइट पर क्लिक करें और स्प्राइट सेटिंग्स पर जाएं। साउंड टैब पर क्लिक करें। आपको स्पाइडरमैन (Spiderman) और मारियो (Mario) नाम की दो ऑडियो फाइलें मिलेंगी।
  3. एडिटिंग एरिया पर वापस जाएं। ऐड एक्सटेंशन बटन पर क्लिक करें और Artificial Intelligence एक्सटेंशन जोड़ें।
  4. ऐड एक्सटेंशन बटन पर क्लिक करें और Text to Speech एक्सटेंशन जोड़ें।
  5. स्क्रिप्टिंग एरिया में when flag clicked ब्लॉक जोड़ें।
  6. Artificial Intelligence एक्सटेंशन से recognize speech for ( ) s in ( ) ब्लॉक को when flag clicked के नीचे रखें और समय को 4 सेकंड में बदलें। ब्लॉक स्पेसिफ़िएड (specified) समय के लिए ऑडियो रिकॉर्ड करता है और क्लाउड में टेक्स्ट के लिए विश्लेषण करता है।
  7. अब, if ( ) else ब्लॉक को recognize speech for ( ) seconds ब्लॉक के नीचे रखें।
  8. if ( ) else ब्लॉक के अंदर, एक ( ) contains ( ) ? ब्लॉक Operators पैलेट से निकाल के रखे। पहले तर्क (argument) में, speech recognition result ब्लॉक जोड़ें, और दूसरे में ” mario ” लिखें। इसलिए, यदि डिकोड किए गए टेक्स्ट में मारियो शब्द है, तो यह if शाखा ब्लॉक को एक्सेक्यूटे करेगा।
  9. if arm के नीचे Text to Speech एक्सटेंशन में से speak ( ) ब्लॉक जोड़ें और “Playing Mario Song!” संदेश लिखें।
  10. इसके बाद, एक play sound ( ) until done ब्लॉक को speak ( ) ब्लॉक के नीचे ऐड करे और Mario चुनें। यह स्क्रिप्ट आखरी में ऐसी दिखती है:
  11. if ( ) else ब्लॉक को डुप्लीकेट करें और इसे else के तहत जोड़े
  12. if की स्थिति में “mario” को “spiderman” में बदलें
  13. speak ब्लॉक में संदेश को “Playing Spiderman Song! !” में बदलें।
  14. ध्वनि को Spiderman में बदलें।
  15. अंत में, else arm के नीचे, एक speak ( ) ब्लॉक जोड़ें और ” Sorry, I am unable to understand the command ” लिखे।
  16. स्क्रिप्ट शुरू करने के लिए green flag पर क्लिक करें। रिकग्निशन विंडो खुल जाएगी। प्रोजेक्ट को अमल में लाने के लिए कमांड बोलें।
  17. फ़ाइल को Alexa के रूप में सेव।

Activity: Output

अगले पाठ पर जाने से पहले सुनिश्चित करें कि आपने assignment पूरा कर लिया है और सबमिट कर दिया है, साथ ही quiz में भाग लें।

 

Table of Contents