पाजिटिव इंडिया:रायपुर;
भारतीय भाषाओं के लिए लिग्विस्टिक डेटा कंसोर्शियम (LDCIL) उच्च शिक्षा विभाग मानव संसाधन और विकास मंत्रालय, भारत सरकार की एक योजना है, जिसे 2007 में स्थापित किया गया है, जोकि केंद्रीय भारतीय भाषा संस्थान, मैसूर द्वारा कार्यान्वित है।
एलडीसी _आईएल ने अपने डेटा वितरण पोर्टल के माध्यम से 4 अप्रैल, 2019 से आर्टिफिशियल
इंटेलिजेंस (एआई) और प्राकृतिक भाषा संसाधन (एनएलपी) के लिए मुख्य रूप से भारतीय भाषाओं में भाषाई संसाधनों का वितरण शुरू कर दिया है, इस पोर्टल का अनावरण माननीय उपराष्ट्रपति श्री वेंकैया नायडू द्वारा किया गया है।
*एलडीसीआईएल डाटा पोर्टलपर* विभिन्न भारतीय भाषाओं के 42 डाटासेट जारी किया है, जैसे, मानक मौलिक टेक्स्ट कॉर्पस बंगाली, बोडो, डोगरी, गुजराती, हिंदी, कन्नड़, कश्मीरी, कोंकणी, मैथिली, मलयालम, मणिपुरी, मराठी, नेपाली, उडिया, पंजाबी, तमिल, तेलुगु, उर्दू, असमिया।
मौलिक स्पीच कॉर्पस_ बंगाली, बोडो, हिंदी, कन्नड, कोकणी, मैथिली, मलयालम, मणिपुरी, मराठी,
नेपाली, पंजाबी, तेलुगु, उर्दू, गुजराती, तमिल, डोगरी, कश्मीरी, उड़िया, असमिया, गुजराती, (एकल),
बहुभाषी भारतीय-अंग्रेज़ी (बंगाली) भारतीय-अंग्रेज़ी (कन्नड)।
मशीन लर्निंग की प्रक्रिया में टेक्स्ट डाटासेट का उपयोग कई प्रकार की भाषा मोडलिंग कार्यों के लिए किया जा सकता है। इसके अतिरिक्त, एलडीसी आईएल के सभी डाटासेट अपनी भाषा के प्रतिनिधि हैं, उनका उपयोग कई प्रकार के भाषाई विश्लेषण के लिए भी किया जा सकता है और यह भाषा और भाषाई अध्ययन तथा भाषा-तकनीक के कई उपविषयों में उपयोगी हो सकता है। स्पीच डाटासेट का उपयोग ऑटोमेटिक स्पीच रेकग्निशन (Automatic Speech Recognition) और टेक्स्ट से स्पीच सिस्टम (Text to Speech Systems) के लिए और साथ ही अन्य प्रकार के स्वन विज्ञान, स्वनिम विज्ञान और ध्वनिक विश्लेषण के लिए किया जा सकता है।
वर्तमान में एलडीसी _आईएल द्वारा पार्ट ऑफ स्पीच (पीओएस) टैगिंग, मॉर्फ़ोलॉजिकल एनालाइजर (एमए), चकिंग और पासिंग, स्पीच डाटा सेगमेंटेशन और एनोटेशन फॉर ऑटोमैटिक स्पीच रेकग्निशन (एएसआर) आदि कार्य किए जा रहे हैं।छत्तीसगढ़ी डाटा (स्पीच एवं टेक्स्ट बुक) के संग्रह के लिए एल डी सी आई एल, भारतीय भाषा संस्थान मैसूर से डॉ. सत्येन्द्र अवस्थी ,सौरभ वारिक, डॉ. सृष्टि सिंह, शांतनु झा , रूपेश पाडे, अंकिता तिवारी आदि विश्वविद्यालय आए हुए हैं। डॉ अवस्थी ने बताया कि संस्थान द्वारा छत्तीसगढ़ी के संवर्धन एवं भाषाई तकनीक के विकास के लिए डाटा का संग्रह किया जा रहा है। यह भाषाई तकनीक के लिए अत्यन्त आवश्यक है। मैसूर सी आई आई एल, से आई हुई पूरी टीम को रविशंकर वि. वि. के. भाषा एवं साहित्य एवं भाषा – अध्ययनशाला का सानिध्य प्राप्त हुआ। जिसमें विभाग की अध्यक्ष प्रो. शैल शर्मा, एवं अन्य प्राध्यापकगणों का सहयोग प्राप्त हुआ। इस कार्य हेतु मुख्य सहयोगी के रूप में श्रीमती गीता शर्मा, डॉ. विभाषा मिश्र गजेन्द्र साहू श्री गुलशन वर्मा , रूपेंद्र साहू . ललिता साहू , टाकेश्वर साहू रहे।
Positive India (www.positiveindia.net.in)has been started in the year 2012 at Raipur by Purshottam Mishra of Chhattisgarh-India. Positive India is offline weekly newspaper and www.positiveindia.net.in is online daily newsportal.Positive India is very active on social media platforms.