ताजा खबर
अहमदाबाद हादसे के बाद एंडरसन-तेंदुलकर ट्रॉफी का अनावरण टला   ||    एअर इंडिया हादसे का वीडियो बनाने वाला 17 साल का आर्यन, पुलिस ने दर्ज किया बयान   ||    LIVE Weather News 14 June 2025: आज से बदल सकता है दिल्ली में मौसम का मिजाज, किन राज्यों में लू का अल...   ||    ‘खराब फ्यूल हो सकता है हादसे का कारण…’, Ahmedabad Plane Crash पर क्या बोले विशेषज्ञ   ||    LIVE आज की ताजा खबर, हिंदी न्यूज Aaj Ki Taaza Khabar, 14 जून 2025: अहमदाबाद पहुंचे पूर्व CM विजय रुप...   ||    अहमदाबाद प्लेन क्रैश पर आया एअर इंडिया के CEO का बयान, जांच को लेकर कही ये बात   ||    Ahmedabad Plane Crash LIVE Update: डीएनए टेस्ट के लिए सैंपल देने आएंगे पूर्व सीएम रूपाणी के बेटे   ||    1 दो नहीं 7 बार सोनम-राज ने रची थी साजिश, पहले 2 प्लान हो जाते सफल तो ना जाती राजा की जान   ||    LIVE Israel Iran War Updates: ईरान के समर्थन में आया चीन, इजरायल के हवाई हमलों को बताया संप्रभुता को...   ||    लॉस एंजेलिस में बिगड़े हालात, अमेरिका ने 200 मरीन जवान किए तैनात   ||   

स्टेबिलिटी एआई ने निकला एक नया टेक्स्ट-टू-ऑडियो एआई प्लेटफॉर्म, आप भी जानें

Photo Source :

Posted On:Thursday, September 14, 2023

मुंबई, 14 सितम्बर, (न्यूज़ हेल्पलाइन) लंदन स्थित जेनेरेटिव एआई कंपनी स्टेबिलिटी एआई ने हाल ही में "स्टेबल ऑडियो" नामक एक नए टेक्स्ट-टू-ऑडियो एआई प्लेटफॉर्म का अनावरण किया है। कृत्रिम बुद्धिमत्ता द्वारा संचालित यह मंच संगीत और ध्वनि उत्पादन में कंपनी के पहले प्रयास का प्रतिनिधित्व करता है। यह 90 सेकंड तक की लंबाई के गाने तैयार कर सकता है, जो इसे विज्ञापनों, ऑडियोबुक और वीडियो गेम सहित विभिन्न परियोजनाओं के लिए उपयुक्त बनाता है।

कंपनी एआई जगत में प्रमुख नेताओं में से एक रही है। हालाँकि, अब तक, यह ज्यादातर AI-जनरेटेड विजुअल्स के लिए जाना जाता था। हालाँकि, अपने पहले टेक्स्ट-टू-ऑडियो जेनरेटिव एआई प्लेटफॉर्म की शुरुआत के साथ, यह ओपनएआई, गूगल और मेटा सहित अन्य उद्योग के नेताओं के साथ सीधे प्रतिस्पर्धा में है।

कथित तौर पर, स्टेबल ऑडियो प्लेटफॉर्म एक डिफ्यूजन मॉडल का उपयोग करता है, वही एआई मॉडल जो कंपनी के अधिक लोकप्रिय इमेज प्लेटफॉर्म, स्टेबल डिफ्यूजन को शक्ति प्रदान करता है। हालाँकि, इसके टेक्स्ट-टू-ऑडियो आधारित स्थिर ऑडियो के मामले में, मॉडल को छवियों के बजाय ऑडियो डेटा के साथ प्रशिक्षित किया गया है। यह उपयोगकर्ताओं को किसी भी लंबाई के गाने या पृष्ठभूमि ऑडियो उत्पन्न करने की अनुमति देता है, जिससे यह विभिन्न परियोजनाओं के लिए एक बहुमुखी उपकरण बन जाता है।

इसके अतिरिक्त, स्थिर ऑडियो प्लेटफ़ॉर्म संगीत-विशिष्ट प्रशिक्षण से गुजरकर और गीत के आरंभ और समाप्ति समय को निर्दिष्ट करने वाले टेक्स्ट मेटाडेटा को शामिल करके पारंपरिक ऑडियो प्रसार मॉडल की सीमाओं को संबोधित करता है। यह उपयोगकर्ताओं को किसी भी लम्बाई के गाने तैयार करने की अनुमति देता है, जो संगीत उत्पादन के लिए एक मूल्यवान सुविधा है।

पहले, ऑडियो प्रसार मॉडल केवल निश्चित अवधि के ऑडियो क्लिप उत्पन्न कर सकते थे। इससे संपूर्ण गीत तैयार करने की उनकी क्षमता सीमित हो गई। स्टेबिलिटी एआई ने स्टेबल ऑडियो के उपयोगकर्ताओं को जेनरेट किए गए गाने की लंबाई निर्धारित करने में अधिक लचीलापन प्रदान करने के लिए मॉडल में सुधार किया है, जिससे उन्हें रचनात्मक प्रक्रिया पर अधिक नियंत्रण मिलता है।

द वर्ज की रिपोर्ट के अनुसार, कंपनी ने एक बयान में कहा, "स्टेबल ऑडियो स्टेबिलिटी एआई की जेनरेटिव ऑडियो रिसर्च लैब, हारमोनाई द्वारा अत्याधुनिक ऑडियो जेनरेशन रिसर्च का प्रतिनिधित्व करता है।" "हम आउटपुट गुणवत्ता, नियंत्रणीयता, अनुमान गति और आउटपुट लंबाई में सुधार के लिए अपने मॉडल आर्किटेक्चर, डेटासेट और प्रशिक्षण प्रक्रियाओं में सुधार करना जारी रखते हैं।"

कंपनी के बयान के अनुसार, स्टेबल ऑडियो प्लेटफॉर्म को संगीत, ध्वनि प्रभाव और व्यक्तिगत उपकरण स्टेम सहित 800,000 से अधिक ऑडियो फाइलों के व्यापक डेटासेट का उपयोग करके प्रशिक्षित किया गया है। डेटासेट में स्टॉक म्यूजिक लाइसेंसिंग कंपनी ऑडियोस्पार्क्स का टेक्स्ट मेटाडेटा भी शामिल है। यह व्यापक डेटासेट आश्चर्यजनक रूप से 19,500 घंटों की विविध ध्वनियों को कवर करता है। स्थिरता एआई नोट करती है कि उसने एक लाइसेंसिंग कंपनी के साथ अपनी साझेदारी के माध्यम से कॉपीराइट सामग्री का उपयोग करने के लिए आवश्यक अनुमतियां सुरक्षित कर ली हैं।

जो उपयोगकर्ता प्लेटफ़ॉर्म का उपयोग करना चाहते हैं, उनके लिए स्टेबिलिटी ऑडियो तीन अलग-अलग मूल्य निर्धारण स्तरों की पेशकश कर रहा है।

मुफ़्त संस्करण उपयोगकर्ताओं को प्रति माह अधिकतम 20 ट्रैक के लिए 45 सेकंड तक ऑडियो उत्पन्न करने की क्षमता प्रदान करता है।

व्यावसायिक स्तर की कीमत $11.99 है और यह उपयोगकर्ताओं को 500 ट्रैक बनाने की अनुमति देता है, जिनमें से प्रत्येक की अवधि 90 सेकंड तक हो सकती है।

एंटरप्राइज़ सदस्यता अनुकूलित उपयोग योजनाओं और मूल्य निर्धारण संरचनाओं की तलाश करने वाली कंपनियों के लिए उपलब्ध है।

विशेष रूप से, मुफ़्त संस्करण में, उपयोगकर्ताओं को व्यावसायिक उद्देश्यों के लिए स्थिर ऑडियो के साथ उत्पन्न ऑडियो का उपयोग करने से प्रतिबंधित किया जाता है।

इस बीच, टेक्स्ट-टू-ऑडियो पीढ़ी कोई नई अवधारणा नहीं है। जेनरेटिव एआई के क्षेत्र में कई प्रमुख खिलाड़ी हैं जो कुछ समय से इस विचार के साथ प्रयोग कर रहे हैं। उदाहरण के लिए, अगस्त में, मेटा ने ऑडियोक्राफ्ट का अनावरण किया, जो जेनरेटिव एआई मॉडल का एक सूट है जो संकेतों के आधार पर प्राकृतिक-ध्वनि वाले भाषण, ध्वनि और संगीत बनाने के लिए डिज़ाइन किया गया है। हालाँकि, ऑडियोक्राफ्ट वर्तमान में केवल शोधकर्ताओं और चुनिंदा ऑडियो पेशेवरों के लिए उपलब्ध है। Google ने कुछ सप्ताह पहले MusicLM भी लॉन्च किया, जो व्यक्तियों को ऑडियो उत्पन्न करने की अनुमति देता है, लेकिन यह भी शोधकर्ताओं तक ही सीमित है।


अहमदाबाद और देश, दुनियाँ की ताजा ख़बरे हमारे Facebook पर पढ़ने के लिए यहां क्लिक करें,
और Telegram चैनल पर पढ़ने के लिए यहां क्लिक करें



मेरा गाँव मेरा देश

अगर आप एक जागृत नागरिक है और अपने आसपास की घटनाओं या अपने क्षेत्र की समस्याओं को हमारे साथ साझा कर अपने गाँव, शहर और देश को और बेहतर बनाना चाहते हैं तो जुड़िए हमसे अपनी रिपोर्ट के जरिए. ahmedabadvocalsteam@gmail.com

Follow us on

Copyright © 2021  |  All Rights Reserved.

Powered By Newsify Network Pvt. Ltd.