سنڌي ٻوليءَ جي راين/ تاثرات واري متن ۾ موجود احساسن جو ڪمپيوٽر مشين ذريعي تجزيو
(An analysis of sentiments available in the opinionated text of Sindhi language while using computer machine)
ڊاڪٽر مظهر علي ڏوتيو
Abstract:
The modern age has connected people all over the globe through the internet and web 2.0, therefore, commodities, products, personalities, and people are turned in to global entities now. People, all over the globe, are showing and writing their opinions and suggestions for various types of products, commodities, personalities, etc. in their native / mother languages. The Sindhi language is spoken, written, and read all over the globe by Sindhi people, therefore, Sindhi people are also using the Sindhi language for writing and showing any type of comment, suggestion and opinion on any type of commodity, product, personality, politician, etc. Lots of research studies have been done on sentiment analysis of various text corpora of various languages of the world to get the polarity of opinions, views, thoughts, etc. which are given by individuals or groups. To analyse the opinionated text of Sindhi language for sentiment and emotions, there is a research problem because very little research work has been done on this issue so far. In order to resolve this issue of sentiment analysis for the Sindhi language, a research model is designed based on rule-based systems, algorithms, and methods. The model extracts the sentiments from the Sindhi text corpus and assesses those sentiments to get the sentiment polarity. In this regard, specific weights/scales have been assigned to every sentiment-based word. Therefore, assessment of weighted sentiment-based words creates the confidence level of polarity and gives a significant result. The results of sentiment analysis are shown in the form of positive, negative, and neutral polarity. The purpose of the current research study is to solve the natural language processing problems of the Sindhi language, especially the sentiment analysis problem and provide a research platform for future research. Therefore, the current study suggests more research work on Sindhi text corpus for aspect-based sentiment analysis using rule-based systems, machine learning, and deep learning models and algorithms.
Keywords: Sentiment Analysis; Opinionated text corpus; Sindhi language, Sentiment Polarity, NLP, Computational Linguistics.
تعارف: ڪنھن به سماج جي بناوٽ ۽ ان سماج ۾ رهندڙ ماڻهن جي حالتن، اخلاق، اٿڻي ويھڻي ۽ ريتن رسمن وغيره کي پرکڻ جو هڪ بھترين طريقو، ان سماج ۾ استعمال ٿيندڙ ٻوليءَ جي جاچ پڙتال آهي. ٻولي ماڻهن جي روين، ڪرتن ۽ معاشي حالتن وغيره بابت ٻڌائيندي آهي (1) اهڙيءَ ريت ٻولي، ماڻهن جي احساسن، جذبن، ڪيفيت ۽ مختلف وقتن تي سامهون ايندڙ راين بابت پڻ ڄاڻ ڏيندي آهي. ماڻهو پنھنجي ٻوليءَ ۾ ڳالهائڻ يا لکڻ وقت مختلف قسم جا نظريا، رايا يا خيال پيش ڪندا آهن. انهن نظرين، راين ۽ خيالن ۾ ماڻهن جي مختلف قسمن جا احساس ۽ جذبا شامل هوندا آهن، جن جي تمام گهڻي اهميت هوندي آهي. انهن جي احساسن ۽ جذبن جي بنياد تي ئي ڪنھن به فرد جي نظريي، خيال، رايي، لکڻيءَ يا ڳالهه کي پرکي سگهبو آهي يا ان جو تجزيو ڪري سگهبو آهي ته اهي نظريا، رايا، خيال، لکڻيون ۽ ڳالهيون مثبت آهن؛ منفي آهن يا غيرجانبدار. هن تحقيق جو مقصد اهو معلوم ڪرڻ آهي ته سنڌي ٻوليءَ ۾ لکجندڙ مواد ۾ ڪھڙي قسم جا احساس يا خيال موجود آهن ۽ انهن خيالن کي ڪمپيوٽر مشين، هٿراڌو ڏاهپ (Artificial intelligence) ذريعي ڪيئن سمجهي سگهي ٿي ۽ ڪھڙي طريقي سان ان مواد مان نتيجا ڪڍي سگهي ٿي. ان سان اهو معلوم ٿيندو ته ڪمپيوٽر ڪيترو سيڪڙو سنڌي ٻوليءَ کي سمجهي ٿو ۽ ڪيترو سيڪڙو درست نتيجا ڏئي ٿو. هن تحقيقي مطالعي ۾ سنڌي ٻوليءَ جي متن کي ڪمپيوٽيشنل لسانيات (Computational Linguistics) ۽ قدرتي ٻولين کي پروسيس (Natural Language Processing) ڪرڻ وارن اوزارن جي ذريعي پروسيس ڪيو ويو آهي ۽ نتيجا حاصل ڪيا ويا آهن.
1.1 مسئلي جو بيان ۽ تحقيق جو مقصد: ڪمپيوٽر مشين (Computer Machine) ذريعي احساسن جو تجزيو (Sentiment analysis) هڪ اهم ۽ پيچيده تحقيقي ڪم آهي. احساسن جو تجزيو انساني ٻولين جي پروسيس ۽ هٿراڌو ڏاهپ (Artificial Intelligence) جي شعبي ۾ اهم تحقيقي ڪم آهي، جيڪو دنيا جي ڪيترين ٻولين تي ٿي رهيو آهي. موجوده دور ۾ ڪن خاص اصولن جي بنياد تي (Rule-Based) ۽ ڪمپيوٽر مشين کي سکيا ڏيڻ (Machine learning) جي طريقن جي ذريعي، انساني ٻولين ۾ موجود لفظن يا جملن جي ڀنڊار (Corpus) جو تجزيو ڪيو وڃي ٿو، جنھن سان ماڻهن جي احساسن، ۽ راين جو تجزيو ڪيو وڃي ٿو، جنھن مان معلوم ٿئي ٿو ته ماڻهو لکڻ يا ڳالهائڻ وقت ڪيترا مثبت يا منفي رايا ڏين ٿا. اهڙي قسم جي تحقيق جو ادارن، ڪمپنين، وکرن، سياسي ۽ سماجي شخصتين وغيره کي تمام گهڻو فائدو پوي ٿو. سنڌي ٻوليءَ جي متن (Text) تي اڳ ۾ هن قسم جي تحقيق نه ٿيڻ جي ڪري، سنڌي متن مان اهو معلوم نه ڪري سگهبو هو ته ماڻهن جا ڪنھن به وکر يا شخصيت جي باري ۾ ڪھڙي قسم جا احساس يا رايا آهن يا هو عام رواجي گفتگؤَ ۾ ڪھڙي قسم جا رايا يا احساس پيش ڪن ٿا ۽ انهن جي قطبيت يا پولارٽي (polority) مثبت آهي يا منفي يا وري غير جانبدار(Nuteral). هي هڪ اهم تحقيقي مسئلو هو، جنھن کي حل ڪرڻ لاءِ هٿراڌو ڏاهپ جا ڪمپيوٽرائزڊ اوزار ۽ مشيني سکيا جا الگوريٿم ٺاهي، خودڪار نظام ذريعي سنڌي متن جو تجزيو ڪيو ويو آهي ۽ انهن تجزين ۽ نتيجن کي هن تحقيق ۾ شامل ڪيو ويو آهي.
هن مسئلي کي حل ڪرڻ جو مقصد سنڌي ٻوليءَ جي ڪنھن به متن ۾ موجود راين، تجويزن ۽ احساسن جي سطح (Level) ماپڻ ۽ معلوم ڪرڻ آهي ۽ انهن جي قطبيت (polority) ڪڍڻ آهي، جنھن سان سنڌي ٻولي دنيا جي ٻين ترقي ڪندڙ ٻولين جي سٿ ۾ شامل ٿيندي ۽ عالمگيريت جي دور ۾ انگريزي ٻولي وانگر پنھنجي مسئلن کي خودڪار ڪمپيوٽر نظام يا پروگرامن ذريعي پاڻ حل ڪري سگهندي. هيءَ تحقيق سنڌي ٻوليءَ جي متن (Text) تي وڌيڪ تحقيق ڪرڻ جا درواز پڻ کوليندي ته جيئن ڪمپيوٽر سائنس، انفرميشن ٽيڪنالاجي، هٿراڌو ڏاهپ ۽ ڪمپيوٽر سائنس سان واسطو رکندڙ ٻين شعبن جا شاگرد، استاد ۽ محقق وڌيڪ تحقيق ڪري سگهن.
1.2 احساسن جو تجزيو: ماڻهو پنھنجي مسئلن، راين، خيالن ۽ نظرين وغيره کي مختلف قسم جي لکڻين، ڳالهين، تقريرن، مشورن ۽ ڪچھرين وغيره ذريعي يا سماجي ميڊيا (2) جي پليٽفارم ذريعي پيش ڪن ٿا، اهڙي طرح ماڻهو مختلف قسم جي ادارن، تنظيمن، وکرن، فلمن، ڊرامن، ڪھاڻين، ناولن، شعرن، ڪتابن، ريتن رسمن، ثقافتن، ٻولين، سياستدانن، ۽ مختلف قسم جي سماجي ۽ سياسي مسئلن تي پنھنجا ويچار ۽ رايا پيش ڪن ٿا يا پنھنجي جذبن جو اظھار ڪن ٿا، جن ۾ انهن ماڻهن جا مختلف قسمن جا احساس شامل هوندا آهن. انهن احساسن، جذبن، راين، خيالن، ۽ نظرين وغيره جي تجزيي يا ڇيد کي احساسن جو تجزيو (Sentiment Analysis) چئبو آهي(3) .
احساسن جو تجزيو، ماڻهن جي راين ۽ خيالن کي ماپي، انهن جو خلاصو (Summary) پيش ڪري ٿو ، جنھن ۾ احساسن ۽ جذبن جي تجزيي جا مختلف قسمن مطابق نتيجا موجود هوندا آهن، جيڪي قطب بندي (Polarity) جي شڪل ۾ ظاهر ڪيا وڃن ٿا، مثال طور، مثبت (Positive) يا منفي (Negative)يا غيرجانبدار ) (Neutral قطبيت يا رايو .(4)
احساسن جي تجزيي ۾ راءِ (Opinion)جي تمام گهڻي اهميت هوندي آهي. راءِ ڏيڻ لاءِ راءِ ڏيندڙ، مفعول جنھن جي باري ۾ راءِ ڏني وڃي ۽ راءِ جي وجود جو هجڻ ضروري هوندو آهي. اهي ٽيئي عمل راءِ ڏيڻ واري عمل جا اهم حصا آهن، جن کي هيٺ مختصر طور بيان ڪجي ٿو.
1. راءِ ڏيندڙ(Opinion Holder) : ڪو به فرد يا ادارو، جيڪو ڪنھن به مفعول يا شيءِ (Object) تي راءِ ڏيڻ جو اهل آهي يا راءِ ڏيڻ جو حق رکي ٿو.
2. وکر يا مفعول (Object): ڪو به وکر، بيان، شخصيت يا ڪنھن به قسم جي لکت وغيره، جنھن تي راءِ ڏئي سگهجي
3. راءِ (Opinion): ڪو به خيال يا ويچار، جنھن ۾ ڪنھن به قسم جو احساس يا جذبو موجود هجي جيڪو ڪنھن به مفعول يا وکر وغيره جي باري ۾ پيش ڪجي ٿو يا مفعول يا وکر وغيره جي گڻ يا اوگڻ کي بيان ڪري.
شڪل 1: راءِ ڏيندڙ (Opinion Holder) ، راءِ (Opinion) ۽ مفعول ( Object) جنھن تي راءِ ڏجي ٿي، کي پيش ڪري ٿي.
مٿين راءِ ڏيڻ جي عمل کي شڪل نمبر 1 جي ذريعي ظاهر ڪجي ٿو. هن شڪل ۾ راءِ ڏيندڙ، راءِ ۽ مفعول يا وکر پيش ڪيا ويا آهن. هن شڪل ذريعي راءِ ڏيڻ جو عمل واضح ٿئي ٿو.
انٽرنيٽ ذريعي هلندڙ ويب Web 2.0کان اڳ ۾ ماڻهو ڪو به وکر وٺڻ لاءِ پنھنجي دوستن يا مائٽن وغيره کان رايا وٺندا هئا، پر هاڻي ماڻهو ان وکر جي ويبسائيٽ تي يا سماجي ميڊيا تي، ان وکر جي باري ۾ معلوم ڪن ٿا ۽ وکر کي استعمال ڪرڻ کانپوءِ، ان وکر تي راءِ ڏين ٿا. تنھنڪري ڪو به وکر وٺڻ يا سافٽويئر انسٽال ڪرڻ کان اڳ ۾ ماڻهن جا رايا ڏسجن ٿا، جن سان ان وکر جي اهميت جي خبر پئجي وڃي ٿي. انهن راين يا تجويزن ۾ ماڻهن جا جذبا ۽ احساس شامل هوندا آهن، جيڪي احساسن جي تجزيي واري نظام لاءِ اهم هوندا آهن. جذبن يا احساسن جو تجزيو هڪ عام عمل آهي، جيڪو جدا جدا وکرن (produscts) يا ادارن لاءِ ماڻهن جي رَوِش، راءِ، احساس ۽ خيال جو تجزيو ڪري ٿو. تنھنڪري، جذبن يا احساسن جو تجزيو ڪنھن هدف (Target) تي مبني هوندو آهي، ڇاڪاڻ ته ڪابه راءِ ڪنھن وکر کي نشانو بڻائي ڏني ويندي آهي. مثال طور: منھنجي ڪار جون سيٽون آرامده آهن، هتي صرف، ڪار جون سيٽون، راءِ ڏيندڙ جون هدف آهن، تنھنڪري راءِ ڏيندڙ، راءِ ڏيڻ جو وقت، راءِ ڏيڻ جي جاءِ، راءِ ڏيڻ يا احساس کي ظاهر ڪرڻ جو سبب ۽ راءِ يا خيال جو هدف اهم هوندا آهن. رايا يا احساس ٻولي يا ثقافت جي بنياد ، نفسيات جي بنياد، خريدار جي راءِ جي بنياد، وکر جي مختلف حصن يا خوبين جي بنياد، عقل جي بنياد، جذبن جي بنياد ، ۽ شعوري بنيادن تي ٿي سگهن ٿا، تنھنڪري جذبن يا احساسن جي قطب بندي (Polarity) مثبت، منفي ۽ غير جانبدار قسمن ۾ ظاهر ٿئي ٿي. هونءَ ته اسم ، صفت ، ظرف ۽ فعل وارا لفظ احساسن، راين ۽ خيالن وغيره جي پولارٽي يا قطب بنديءَ کي ظاهر ڪن ٿا، پر صفتن وارا لفظ ڪنھن عام راءِ واري متن جي قطبيت پيش ڪرڻ ۾ وڌيڪ عام ۽ اهم آهن.
قطبيت يا پولارٽي لاڳاپيل ماڻهن جي احساس ۽ راين بابت ڄاڻ ڏئي ٿي. پولارٽي جذبي يا احساس يا راءِ جي سطح (Level) تي ڀاڙيندي آهي. تنھنڪري، جذبي يا احساس يا راءِ جي پولارٽي، انهن جي اعتماد جي سطح تي بلند يا گهٽ ٿي سگهي ٿي. اهڙي طرح جذبن يا احساسن کي ماپڻ لاءِ انهن جي وزن يا ماپ جي پئماني (Scale) کي مقرر ڪيو وڃي ٿو، جيڪو جذبن يا احساسن جي مثبت يا منفي شدت ۽ ان شدت جي ماپ کي ظاهر ڪري ٿو. مثال طور: لفظ ٺيڪ، سٺو، بهتر ۽ بهترين جي شدت جي ماپ مختلف ٿيندي. اهڙي طرح مثبت وزن يا ماپ +1 کان +5 تائين ٿي سگهي ٿو ۽ منفي وزن يا ماپ کي وري ڪاٽو 1 کان ڪاٽو 5 جي ذريعي معلوم ڪري سگهجي ٿو. اهڙي قسم جي وزنن يا ماپن سان احساسن يا جذبن جي اعتماد جي سطح يا Confidence level معلوم ڪري سگهجي ٿي، جنھن به لفظ يا جملي جي مثبت يا منفي اعتماد جي سطح وڌيڪ هوندي ته اها ان لفظ يا جملي جي پولارٽي ٿيندي. اهڙيءَ ريت جيڪڏهن ڪنھن لفظ يا جملي جو وزن ٻڙي (Zero) هوندو يا ڪنهن به لفظ يا جملي جي پولارٽي نه مثبت هوندي ۽ نه ئي وري منفي هوندي، ته ان جملي يا لفظ جي پولارٽي غيرجانبدار (Neutral)ٿيندي.
احساسن جو تجزيو ڪيفيت، جذبن، مزاج، رَوِش، احساس ۽ ان سان گڏ خريدار جي پنھنجي خصلتن يا پيغام جي تحقيق جي اهم صفتن کي پرکڻ ۾ اهم ڪردار ادا ڪري ٿو (5). احساسن جو تجزيو ڪندڙ ڪمپيوٽر ايپليڪيشن موجوده قدرتي ٻولي جي پروسيس يا (Natural Language Processing) ۽ هٿراڌو ڏاهپ جي نظام جي بنياد تي ڪم ڪندڙ ڪمپيوٽرائزڊ ايپليڪيشن آهي، جيڪا ڪنھن به متن مان فاعلي (Subjective) متن کي دريافت ڪري، ان مان جذباتي ڪيفيتن يا جذبن يا راين ۽ احساسن کي جاچي، انهن جو تجزيو ڪري ٿي، اهڙي طرح جذبن يا احساسن جو تجزيو ڪري، انهن جي مثبت يا منفي قطبيت يا پولارٽي کي ظاهر ڪري ٿي (6)، مثال: ’انب مٺو آهي‘ هيءُ هڪ فاعلي (Subjective) جملو آهي، جنھن ۾ انب جي خصوصيت مٺِي ظاهر ڪئي وئي آهي، اها خصوصيت ان جملي جي مثبت پولارٽي (Polority) کي ظاهر ڪري ٿي. اهڙيءَ طرح ٻئي جملي ’صوف کٽو آهي‘ ۾ ’کٽو‘ صوف جي منفي خصوصيت کي ظاهر ڪري ٿو، تنھنڪري ان جملي جي پولارٽي (Polority)منفي ٿيندي. پر اهو ضروري نه آهي ته هر فاعلي (Subjective) جملو مثبت يا منفي پولارٽي ظاهر ڪري. مثال طور، آءٌ فلم ڏسان ٿو. هي جملو فاعلي (Subjective) ته آهي پر ان ۾ ڪنھن به قسم جو احساس يا رايو موجود نه آهي تنھنڪري ان جملي ۾ فلم جي مثبت يا منفي خصوصيت شامل نه آهي. انڪري ئي هن جملي جي پولارٽي مثبت يا منفي نه آهي. اهڙي قسم جي جملي کي غيرجانبدار (Nuteral) جملو چئبو، تنھنڪري ان جملي جي پولارٽي به غير جانبدار (Nuteral) ٿيندي.
2. تحقيق جو پسمنظر ۽ احوال: 1950ع کان پوءِ دنيا ۾ ٽيڪنالاجيءَ جي ترقي جي ڪري تمام گهڻيون تبديليون آيون آهن ۽ اڃا تائين اهي تبديلين اچڻ وارو عمل جاري آهي، جنھنڪري دنيا تيزيءَ سان ترقي ڪري رهي آهي. اهي تبديليون دنيا جي ساخت (Structure) کي به تبديل ڪري رهيون آهن. سن 2000ع کان پوءِ ته ٽيڪنالاجيءَ جي ترقي دنيا کي هڪ گلوب (Globe) ۾ تبديل ڪري ڇڏيو آهي. جيتوڻيڪ دنيا کي ان گلوب ۾ تبديل ڪرڻ جو سلسلو 1990ع کان پوءِ شروع ٿي چڪو هو . دنيا جو هڪ گولي يا گلوب ۾ تبديل ٿيڻ جي ڪري عالمگير سماج جڙڻ شروع ٿي ويو، جنھن پوري دنيا کي عالمي ڳوٺ (Globel village) ۾ تبديل ڪري ڇڏيو آهي. ان پوري عمل ۾ ٽيڪنالاجي، خاص ڪري انفرميشن ٽيڪنالاجيءَ جو اهم ڪردار رهيو آهي. عالمي ڳوٺ جڙڻ جي ڪري دنيا جي سمورين ٻولين جي اهميت به وڌي وئي آهي. موجوده دور ۾ ڪمپيوٽر ٽيڪنالاجيءَ مختلف ٻولين کي سمجهي رهي آهي ۽ انهن جو لسانياتي تجزيو ڪري رهي آهي ته جيئن ڄاڻ جي حصول (Information retrieval) ۽ ڳولا جي نظام (Search engines) کي بھتر ۽ آسان بڻائڻ سان گڏ مختلف ٻولين جي متن جو تجزيو(Text analysis) ۽ ترجمو ڪري سگهجي. ان سلسلي ۾ ڪمپيوٽر ٽيڪنالاجيءَ کي استعمال ڪندي، دنيا جي ٻولين جي مختلف پھلوئن، خاص ڪري صوتيات، نحو ۽ صرفيه تي گهڻو ڪم ٿي رهيو آهي. نحو ۽ صرفيه جي ڪري ڪنھن به ٻوليءَ جي متن جو ڇيد ڪري ان جي ساخت کي جاچيو وڃي ٿو ۽ ترجميڪاري، ڳولا جي نظام ۽ ڄاڻ جي حصول جي نظامن کي بھتر ڪيو وڃي ٿو. اهڙي طرح مختلف قسم جي متن جو تجزيو ڪري انهن ۾ موجود احساسن ۽ جذبن جو تجزيو ڪيو وڃي ٿو ته جيئن ماڻهن جي خيالن ۽ راين جي بھتر طريقي سان پرک ڪري سگهجي. متن جي بنياد تي جذبن جي سڃاڻپ ۽ احساسن جو تجزيو، جملن ۾ موجود جذبن ۽ احساسن جي موجودگي ۽ قطبيت کي ظاهر ڪن ٿا (7)
هن وقت دنيا جي ڪيترين ئي ٻولين ۾ موجود ڪارپس (لفظي ذخيري) تي احساسن جي تجزيي جي حوالي سان تحقيق ڪئي وڃي ٿي. جذبن يا احساسن جي تجزيي تي پھريون تحقيقي مطالعو 2003ع ۾ پيش ڪيو ويو.(8) جذبي جي چڪاس ۽ تجزيي تي اڪثر ڪري تحقيق انگريزي ٻولي جي متن تي ڪئي وئي آهي (9)، (10) پر هن وقت دنيا جي ڪيترين ئي ٻولين تي ان قسم جي تحقيق گهڻي تعداد ۾ ٿي رهي آهي. انهن ٻولين ۾ سنڌي ٻولي به شامل آهي. ان سلسلي ۾ سنڌي ٻوليءَ جو ڪارپس (corpus) ٺاهي، ان جي مختلف پھلوئن تي تحقيق ڪئي وئي آهي، جنھن مان سنڌي ٻولي جي ساخت ۽ احاطي (Domain)، قد ڪاٺ ۽ بيهڪ وغيره جي خبر پوي ٿي (11). سنڌي ٻوليءَ جي ڪارپس جي بنياد تي صرفيه ۽ نحو سان گڏ احساسن جي تجزيي تي پڻ تحقيق ٿي رهي آهي، جيڪا ڪيترن ئي قومي ۽ بين الاقوامي تحقيقي جرنلس ۾ ڇپجي چڪي آهي(12). سنڌي ٻوليءَ جي متن يا ڪارپس ۾ موجود احساسن، جذبن، راين ۽ تجويزن تي ٿيندڙ هي تحقيق اڳين تحقيق جي هڪ ڪڙي آهي، جنھن ذريعي سنڌي ٻوليءَ جي ڪارپس کي ڪمپيوٽر مشين جي هٿراڌو ڏاهپ جي اوزارن (Artificial Intelligence Applications) جي ذريعي تجزيو ڪري احساسن يا جذبن يا راين وغيره جي پولارٽي ڪڍي وڃي ٿي ۽ انهن جو تجزيو ڪري ان جو تتُ/ خلاصو پيش ڪيو وڃي ٿو.
3. طريقيڪار: هيءَ هڪ تجرباتي تحقيق آهي، جنھن ذريعي ماڻهن جي ويچارن، رويَن، تجويزن، نظرين ۽ قياس آرائين وغيره کي ڪمپيوٽرائزڊ الگوريٿم، ڊيٽا اسٽرڪچرس ۽ هٿراڌو ڏاهپ جي اصولن ۽ ايجنٽس جي بنياد تي حل ڪيو ويو آهي. سنڌي ٻوليءَ لاءِ هٿراڌو ڏاهپ جي بنياد تي مخصوص قسم جون ڪمپيوٽرائزڊ ايپليڪيشن ٺاهيون ويون آهن، جيڪي سنڌي متن جو گرامر جي بنياد تي ڇيد ڪري، ان جو تجزيو ڪن ٿيون، جنھن ذريعي اهو معلوم ٿئي ٿو ته راءِ ڏيندڙ ڪھڙي وکر(product)، شخصيت يا ڪنھن شيءِ يا مفعول لاءِ ، ڪھڙي قسم جي راءِ ڏئي ٿو ۽ ان راءِ ۾ ان جا ڪھڙي قسم جا جذبا ۽ احساس شامل آهن. شڪل 2 احساسن کي ڳولڻ ۽ انهن جي پولارٽي ڪڍڻ جي تحقيقي طريقيڪار کي بيان ڪري ٿي.
شڪل 2: احساسن کي ڳولڻ ۽ انهن جي پولارٽي ڪڍڻ جو تحقيقي طريقيڪار
ڪنھن به تحقيق لاءِ مسئلي جو هجڻ ۽ ان مسئلي کي سمجهڻ ضروري هوندو آهي. مسئلي کي سمجهڻ سان ئي تحقيقي سوال، تحقيق جا مول ۽ متا ۽ مقصد بيان ڪري سگهبا آهن. تنھنڪري، هي تحقيق ڪرڻ لاءِ سڀ کان پھريان مسئلي کي ڳوليو ويو ۽ ان کي مختلف تحقيقي رخن کان پرکيو ۽ سمجهيو ويو. مسئلي کي حل ڪرڻ لاءِ گهربل مواد سماجي ميڊيا جي اوزارن يا ايپليڪيشنس، سنڌ سلامت آنلائين ڪتاب گهر تي موجود ڪتابن ۽ گوگل فارم جي ذريعي حاصل ڪئي وئي آهي. حاصل ٿيل متن کي هڪ ڪارپس يا جملن جي ڀنڊار جي شڪل ڏني وئي.
اهڙيءَ طرح، انهن جملن کي سنڌي ٻوليءَ لاءِ ٺاهيل احساسن جي تجزيي واري ڪمپيوٽرائزڊ نظام (Sentiment Analysis System For Sindhi Language) ۾ پروسيس ڪيو ويو ۽ گهربل نتيجا حاصل ڪيا ويا، جيڪي هن مقالي جي نتيجن واري حصي ۾ رکيا ويا آهن. سنڌي ٻوليءَ جي متن ۾ موجود احساسن کي جاچڻ واري نظام کي ٺاهڻ لاءِ هڪ خاص الگوريٿم ۽ ڊيٽا اسٽرڪچر جي بنياد تي ڪمپيوٽرائزڊ ماڊل ٺاهيو ويو آهي، جيڪو سنڌي متن کي سمجهي، ان مان نتيجا اخذ ڪري ٿو. اهو ماڊل هيٺينءَ ريت ڪم ڪري ٿو:
1. سنڌي متن يا جملي کي پڙهي ٿو.
2. سنڌي جملي کي کاٻي کان ساڄي طرف آڻي، ان جي لکت کي ساڄي طرف کان شروع ڪري ٿو (ان لاءِ هڪ لُوپ (Loop)، جنھن کي وائيل لوپ (while loop) چئجي، ٿو سو هلايو وڃي ٿو، جيڪو سنڌي جملي کي عربي-فارسي ’عريبڪ پرشيا‘ جي لپيءَ مطابق ساڄي پاسي کان لکي ٿو)
3. سنڌي جملي جي ڀاڃ ڪري، ان کي جدا جدا لفظن ۾ پيش ڪري ٿو (ڀاڃ جو جدا الگوريٿم ٺاهيو ويو آهي، جيڪو هن ماڊل ۾ هڪ خاص عمل ذريعي گهرايو وڃي ٿو)
4. ڀاڃ ذريعي جدا ڪيل لفظن، نشانين ۽ پوري دم کي عالمي گرامر ۽ سنڌي گرامر تحت نشان لڳايو وڃي ٿو (نشان لڳائڻ جو نظام هڪ خاص الگوريٿم ۽ ڊيٽا اسٽرڪچر تحت ٺاهيو ويو آهي جيڪو هڪ خاص عمل ذريعي گهرايو ويو آهي.)
5. جيڪڏهن پروسيسر اهو سڀ ڪجهه سمجهي وڃي ٿو ته پوءِ هو سنڌي متن ۾ موجود احساس کي ڳولي، انهن کي مثبت ۽ منفي وزن ڏئي ٿو. (ان پروسيس لاءِ هڪ الڳ لُوپ هلي ٿو، جنھن کي فار لوپ (For loop) چئجي ٿو)
6. اهو لوپ احساس وارا لفظ ڳولي، انهن کي وزن ڏئي الڳ لڳ رکندو وڃي ٿو ۽ آخر ۾ مثبت ۽ منفي وزنن وارن لفظن کي جدا جدا توري ٿو، جنھن جو وزن وڌيڪ هوندو ان جي قطبيت يا پولارٽي کي بيان ڪندو. اهڙيءَ طرح ٺلهن واري چارٽ (Bar Chart) جي بنياد تي هڪ خلاصو (Visual Summary) ظاهر ڪندو، جنھن ۾ جملي جي قطبيت بيان ٿيل هوندي.
7. جيڪڏهن جملي ۾ ڪنھن به قسم جي قطبيت موجود نه آهي ته اهو غير جانبدار neutral جملو هوندو.
8. جيڪڏهن جملي ۾ مثبت ۽ منفي قطبيت يا پولارٽي وارا لفظ هڪ جيترا هوندا ته اهو جملو گاڏڙ ساڏڙ يا گڏيل قطبيت (Mix Polarity)وارو جملو ٿيندو
9. هي عمل هر جملي لاءِ ورجائبو رهبو.
4. نتيجا ۽ بحث:
تحقيق جا نتيجا تحقيق جي طريقيڪار، تحقيق جي ماڊل، تحقيق جي سوالن ۽ تحقيق جي مقصد جي بنياد تي ڪڍيا ويندا آهن تنھنڪري هن تحقيق ۾ جيڪي نتيجا بيان ڪيا وڃن ٿا، سي تحقيق جي مسئلي، تحقيقي سوالن ۽ تحقيق جي مقصد جي بنياد ۽ تحقيق جي طريقيڪار ۽ تحقيقي ماڊل جي بنياد تي پيش ڪيا وڃن ٿا، جيڪي هيٺ مخلتف شڪلن ۽ جدولن جي صورت ۾ بيان ڪيا
ويا آهن. هي سمورا نتيجا هٿراڌو ڏاهپ جي بنياد تي ٺاهيل ڪمپيوٽرائزڊ پروگرام https://sindhinlp.com/sentiment.php (جيڪو سنڌي ٻوليءَ لاءِ مٿي بيان ڪيل الگوريٿم (Algorithm) جي بنياد تي ٺاهيل ماڊل ذريعي ٺاهيو ويو آهي) ذريعي ڪڍيا ويا آهن، تنھنڪري هي نتيجا هڪ خودڪار نظام ذريعي اخذ ٿيل آهن، جنھن ۾ ڪنھن انساني راءِ جي شموليت نه آهي.
سنڌي ٻوليءَ جي ٺاهيل ڪارپس مان مختلف قسم جا جملا ڪڍي، انهن کي سنڌي ٻوليءَ جي احساسن کي ماپڻ واري نظام ۾ پروسس ڪري نتيجا حاصل ڪيا ويا آهن. سنڌي ڪارپس مان هڪ جملو ’سنڌي ٻولي دنيا جي پراڻي ٻولي آهي‘ احساسن کي ماپڻ واري نظام ۾ پروسس ڪري، جملي جو تجزيو ڪيو ويو. جدول 1 سنڌي جملي کي خودڪار نظام ذريعي ڪيل ڇيد جا نتيجا ظاهر ڪري ٿي، جنھن مان جملي ۾ موجود راين ۽ احساسن جي خبر پوي ٿي. جملي ۾ صفت وارو لفظ ’پراڻي‘ ٻوليءَ جي باري ۾ راءِ ۽ ان ۾ موجود احساس کي ظاهر ڪري ٿو. گرامري ڇيد سان راءِ ۽ احساس رکندڙ لفظ معلوم ٿين ٿا.
جدول 1: سنڌي جملي ’سنڌي ٻولي دنيا جي پراڻي ٻولي آهي‘ جو عالمي ۽ سنڌي گرائمر جي ڳالهائڻ جي لفظن مطابق لڳايل نشانن کي ظاهر ڪري ٿي.
سنڌي ڳالهائڻ جو نشان عالمي ڳالهائڻ جو نشان سنڌي لفظ
اسم خاص PROPN سنڌي
اسم NOUN ٻولي
اسم NOUN دنيا
حرفِ جر ADP جي
صفت ADJ پراڻي
اسم NOUN ٻولي
فعل معاون AUX آهي
جدول 1 ۾ 7 لفظ موجود آهن، جن ۾ صرف هڪ لفظ ’پراڻي‘ سنڌي ٻوليءَ بابت راءِ کي ظاهر ڪري ٿو ۽ ان ۾ هڪ احساس موجود آهي، جيڪو سنڌي ٻوليءَ جي حيثيت کي ظاهر ڪري رهيو آهي. شڪل 3 ’سنڌي ٻولي دنيا جي پراڻي ٻولي آهي‘ جو تجزيو پيش ڪري ٿي ۽ جملي ۾ موجود احساس جي پولارٽي کي ظاهر ڪري ٿي.
شڪل 3: سنڌي جملي’سنڌي ٻولي دنيا جي پراڻي ٻولي آهي‘ ۾ موجود احساسن جو تجزيو پيش ڪري ٿي ۽ جملي جو نتيجو مثبت قطبيت ۾ ظاهر ڪري ٿي.
’سنڌي ٻولي دنيا جي پراڻي ٻولي آهي‘ ۾ موجود احساسن جو تجزيو جملي جي مثبت پولارٽي يا قطبيت کي ظاهر ڪري ٿي. هي شڪل ڪمپيوٽر جي پاڻمرادي يا خودڪار نظام ذريعي حاصل ڪئي وئي آهي. هي نظام احساسن جو وزن ڪري، انهن کي قطبيت جي بنياد تي جدا ڪري، انهن جو جوڙ ڪري ٿو ۽ ان جي ميزان يا ٽوٽل جي بنياد تي اعتماد جي لڪير يا اعتماد جي سطح بيان ڪري ٿو. اهڙيءَ طرح جنھن قطبيت يا پولارٽيءَ جو وزن وڌيڪ ٿيندو، ان جي اعتماد جي سطح به وڌندي. هن جملي جي تجزيي ۾ مثبت قطبيت جي اعتماد جي سطح وڌيڪ آهي، تنھنڪري هن جملي جي قطبيت يا پولارٽي مثبت آهي. جيتوڻيڪ ڪن جملن ۾ پراڻي يا پراڻو لفظ منفي قطبيت کي ظاهر ڪندو آهي، مثال طور هي گهر پراڻو آهي. هتي لفظ پراڻو جو مطلب منفي آهي، ڇاڪاڻ ته ان سان صفت ’پراڻو‘ اسم ’گهر‘ جي اوَگڻ کي ظاهر ڪري ٿي.
احساسن جي تجزيي جي پاڻمرادي/خودڪار نظام ۾ هڪ ٻيو سنڌي جملو ’اسلم جيڪي انب موڪليا سي خراب هئا‘ پروسيس ڪيو ويو . جدول 2 ان جملي جو عالمي ۽ سنڌي گرامر جي ڳالهائڻ جي لفظن مطابق ڇيد ڪري ٿي، جنھن مان خبر پوي ٿي ته جملي ۾ ڪھڙا لفظ اسم، صفت، ظرف ۽ فعل آهن، اهڙن لفظن جي بنياد تي جملي جو احساساتي تجزيو ڪيو وڃي ٿو.
جدول 2 سنڌي جملي ” اسلم جيڪي انب موڪليا سي خراب هئا“ کي عالمي ۽ سنڌي گرامر جي ڳالهائڻ جي لفظن مطابق لڳايل نشانن کي ظاهر ڪري ٿي.
سنڌي ڳالهائڻ جو نشان عالمي ڳالهائڻ جو نشان سنڌي لفظ
اسم خاص PROPN اسلم
ضمير اشارو DET جيڪي
اسم NOUN انب
فعل VERB موڪليا
ضمير اشارو DET سي
صفت ADJ خراب
فعل VERB هئا
جدول 2 ۾ سنڌي جملي’ اسلم جيڪي انب موڪليا سي خراب هئا‘ جا ست لفظ موجود آهن، جن ۾ هڪ لفظ ’خراب‘ صفت آهي. جڏهن ته ٻيا لفظ صفت نه آهن، جيڪي انبن جو وجود، ساخت ۽ ذائقي کي ته ظاهر ڪن ٿا، پر اهي انبن جا گڻ يا اوگڻ به ٻڌائين ٿا. شڪل 4 سنڌي جملي ’اسلم جيڪي انب موڪليا سي خراب هئا‘ جو تجزيو پيش ڪري ٿي ۽ جملي ۾ موجود احساسن جي پولارٽيءَ کي ظاهر ڪري ٿي. هن جملي ۾ صفت-خراب، اسم-انب، جا اوگڻ بيان ڪري ٿي، جنھنڪري ان لفظ جو وزن به منفي ٿئي ٿو. خودڪار نظام سمورن لفظن کي جاچي ٿو ۽ صفت خراب جي منفي وزن جي بنياد تي اعتماد جي سطح ٺاهي ٿو، جنھن بنياد تي جملي جي قبطبيت يا پولارٽيءَ کي بيان ڪري ٿو. احساسن جي تجزيي وارو ڪمپيوٽرائزڊ نظام جملي ’اسلم جيڪي انب موڪليا سي خراب هئا‘ جي تجزيي ۾ جملي جي منفي قطبيت جي اعتماد جي مٿين سطح ۽ مثبت قطبيت جي 0 سطح جي بنياد تي نتيجو منفي ظاهر ڪري ٿو.
شڪل 4 سنڌي جملي ’ اسلم جيڪي انب موڪليا سي خراب هئا‘ جو تجزيو پيش ڪري ٿي ۽ جملي ۾ موجود احساس جي پولارٽيءَ کي منفي ظاهر ڪري ٿي.
سنڌي جملو ’آئون فلم ڏسان ٿو‘ احساسن جي تجزيي واري پاڻمرادي يا خودڪار ڪمپيوٽرائزڊ پروگرام ۾ پروسيس ڪيو ويو، جنھن جي ڀاڃ ڪرڻ کانپوءِ سنڌي گرامر ۽ عالمي گرامر جي ڳالهائڻ جي لفظن مطابق نشان لڳايا ويا آهن. جدول 3 سمورن لفظن کي گرامر جي لفظن مطابق نشان لڳائي جدا جدا ظاهر ڪري ٿي.
جدول3: سنڌي جملي ’آئون فلم ڏسان ٿو‘ کي عالمي ۽ سنڌي گرامر جي ڳالهائڻ جي لفظن مطابق لڳايل نشانن کي ظاهر ڪري ٿي:
سنڌي ڳالهائڻ جو نشان عالمي ڳالهائڻ جو نشان سنڌي لفظ
ضمير PRON آئون
اسم NOUN فلم
فعل VERB ڏسان
فعل VERB ٿو
جدول 3 ۾ چار لفظ بيان ڪيل آهن، جن ۾ اسم يا فعل ڪنھن به راءِ يا تجويز وغيره کي ظاهر نه پيا ڪن. نه ئي وري ڪا صفت موجود آهي جيڪا اسم يا ضمير جو گڻ يا اوگڻ بيان ڪري. تنھنڪري ’آءٌ فلم ڏسان ٿو‘ جملي ۾ مثبت يا منفي قطبيت نظر ڪون اچي پئي. شڪل 5 ۾ احساسن جي تجزيي ۽ خلاصي کي ظاهر ڪيو ويو آهي. ان شڪل مطابق مثبت ۽ منفي لفظن جو وزن 0 ٻُڙي آهي، جيڪا ڪنھن به قسم جي مثبت يا منفي اعتماد جي سطح کي ظاهر نه پئي ڪري، تنھنڪري سنڌي جملي ’آءٌ فلم ڏسان ٿو‘ جو نتيجو غير جانبدار (Neutral) قطبيت يا پولارٽي آهي. ان جو مطلب ٿيو ته جملو ته فاعلي آهي، پر ان ۾ موجود مفعول ڪنھن به قسم جي تجويز يا راءِ کي ظاهر نه پيو ڪري، جنھن ۾ احساس موجود هجي. اهڙي قسم جي جملن جو تجزيو هميشه غير جانبدار پولارٽي يا قطبيت کي ظاهر ڪري ٿو.
شڪل 5 سنڌي جملي ’آءٌ فلم ڏسان ٿو‘ جو تجزيو پيش ڪري ٿي ۽ جملي ۾ موجود احساس جي پولارٽيءَ کي غير جانبدار ظاهر ڪري ٿي.
ساڳئي جملي ۾ جيڪڏهن ڪو صفت وارو لفظ شامل ڪريو، جيڪو اسم ’فلم‘ جو گڻ يا اوگڻ بيان ڪري ته جملي جو نتيجو تبديل ٿي ويندو. مثال ساڳئي جملي ۾ لفظ ’سٺي‘ جو اضافو ڪجي ته جملي جو نتيجو مَٽجي ويندو. ڇاڪاڻ ته لفظ سٺي، جملي ۾ موجود لفظ ’فلم‘ جو گڻ بيان ڪري ٿو، تنھنڪري جملي جي احساسن واري قطبيت به تبديل ٿي ويندي. جدول 4 سنڌي جملي ’مان سٺي فلم ڏسان ٿو‘ جو سنڌي ۽ عالمي گرامر مطابق ڇيد پيش ڪري ٿي، جنھن سان خبر پوندي ته ڪھڙو لفظ هڪ سٺو احساس پيش ڪري ٿو.
جدول 4 سنڌي جملي ’آءٌ سٺي فلم ڏسان ٿو‘ کي عالمي ۽ سنڌي گرامر جي ڳالهائڻ جي لفظن مطابق لڳايل نشانن کي ظاهر ڪري ٿي
سنڌي ڳالهائڻ جو نشان عالمي ڳالهائڻ جو نشان سنڌي لفظ
ضمير PRON آئون
صفت ADJ سٺي
اسم NOUN فلم
فعل VERB ڏسان
فعل VERB ٿو
جدول 4 ۾ جملي ’آئون سٺي فلم ڏسان ٿو‘ ۾ لفظ ’سٺي‘ جيڪو صفت آهي، سا اسم واري لفظ ’فلم‘ جو گڻ پيش ڪري ٿي، جنھن سان مثبت احساس پيدا ٿئي ٿو ۽ جملي جو نتيجو تبديل ٿئي ٿو. جملي ۾ موجود لفظ ’سٺي‘ جو وزن مثبت نشان سان ظاهر ٿئي ٿو، تنھنڪري جملي جو خودڪار ڪمپيوٽرائزڊ نظام ذريعي تجزيو به مثبت ٿئي ٿو. شڪل 6 جملي جو ڪمپيوٽرائزڊ خلاصو پيش ڪري ٿو، جنھن مان جملي جي مثبت قطبيت نظر اچي ٿي.
شڪل 6 سنڌي جملي ’ آئون سٺي فلم ڏسان ٿو‘ جو تجزيو پيش ڪري ٿي ۽ جملي ۾ موجود احساس جي پولارٽي کي مثبت ظاهر ڪري ٿي.
5. تحقيق جو حاصل مقصد:
ڪا به تحقيق ڪرڻ لاءِ ڪا حد (Limitation) مقرر ڪئي ويندي آهي، جيڪا تحقيق جي دائري کي ظاهر ڪندي آهي. تنھنڪري هيءَ تحقيق جيڪا هڪ خاص مسئلي جي بنياد تي ڪئي وئي آهي، ان به جي حد (Limitation) مقرر ٿيل آهي ۽ اُن حد جي اندر ئي تحقيقي ڪم ڪيو ويو آهي. تحقيقي مسئلي ۾ ظاهر ڪيو ويو آهي ته سنڌي ٻوليءَ ۾ بيان ڪيل تجويزين، راين، نظرين ۽ قياس آراين وغيره ۾ موجود مختلف قسم جي احساسن جو تجزيو ڪري، قطبيت معلوم ڪجي ته جيئن خبر پوي ته اهي احساس مثبت آهن يا منفي يا غيرجابندار. ان مسئلي جي بنياد تي هڪ خاص ماڊل ۽ تحقيق جو طريقيڪار بيان ڪيو ويو آهي، جنھن جي بنياد تي هڪ ڪمپيوٽرائزڊ خودڪار نظام ٺاهيو ويو آهي، جيڪو سنڌي جملن جي ڀنڊار جو تجزيو ڪري نتيجا ظاهر ڪري ٿو. هي نظام جملي کي جاچي، ان جي ڀاڃ ڪري ۽ ان جو ڇيد ڪري ٿو، جنھن سان معلوم ٿئي ٿو ته پاڻمرادي يا خودڪار نظام جي ڪم ڪرڻ جي صلاحيت درست ۽ برابر آهي. نتيجن جي درستگيءَ ماڊل جي درستگي کي ظاهر ڪري ٿي ۽ ان کي قابل بڻائي ٿي ته مستقبل ۾ وڌيڪ جملن يا متن کي ان خودڪار نظام ۾ پروسيس ڪري، احساسن جي تجزيي جا نتيجا اخذ ڪري سگهجن ٿا. نتيجن ۽ قطبيت جي بنياد تي فرد، خاندان، شخصيتون ۽ ادارا وغيره درست ۽ ڏُور رَس فيصلا ڪري سگهن ٿا، جنھن سان مستقبل ۾ ادارن جي ڪارڪردگي بھتر ڪري سگهجي ٿو. نتيجن واري باب ۾ جيڪي نتيجا ۽ انهن جا تجزيا پيش ڪيا ويا آهن، سي مختلف جملن جي بنياد تي حاصل ڪيا ويا آهن، جيڪي جدولن ۽ شڪلن جي صورت ۾ پيش ڪيا ويا آهن. نتيجا درست قطبيت کي ظاهر ڪن ٿا، جيڪي تحقيق جي مسئلي ۽ مقصد مطابق آهن. هي تحقيق سنڌي ٻوليءَ ۾ ٿيندڙ تحقيق (جيڪا ڪمپيوٽر ۽ هٿراڌو ڏاهپ جي بنياد تي ڪئي وئي آهي) ۾ هڪ نئين عنوان ۽ موضوع جو واڌارو ڪري ٿي، جنھن سان مستقبل ۾ ٿيندڙ تحقيق جا درواز کلندا.
جيتوڻيڪ موجوده تحقيق سنڌي ٻوليءَ جي متن ۾ موجود احساسن جو تجزيو ڪري قطبيت (Polority)جي بنياد تي خودڪار ڪمپيوٽرائزڊ نظام جي ذريعي نتيجا ظاهر ڪري، سنڌي ٻوليءَ ۾ لکجندڙ راين، تجويزن، خيالن، قياس آراين ۽ نظرين وغيره ۾ موجود احساسن کي مثبت، منفي يا غيرجانبدار قطبيت يا درجن يا زمرن ۾ ظاهر ڪري ٿي، تنھن هوندي به مستقبل ۾ ڪمپيوٽر يا هٿراڌو ڏاهپ جا نوان طريقا يا الگوريٿم کڻي، انهن کي سنڌي ٻوليءَ تي لاڳو ڪري، مختلف ۽ نوان نتيجا حاصل ڪري سگهجن ٿا. ان سان سنڌي ٻولي ۽ ان ۾ ٿيندڙ تحقيق جي ترقي ٿيندي.
حوالا
(1) ڏوتيو، مظھر علي ’عالمگيريت ۽ سنڌي سماج‘، پيڪاڪ پبلشرز ڪراچي سنڌ (2020)، ISBN 978-969-791439-5
(2)E. W. T. Ngai, S. S. C. Tao, and K. K. L. Moon, “Social media research: Theories, constructs, and conceptual frameworks,” Int. J. Inf. Manage., vol. 35, no. 1, pp. 33–44, Feb. 2015.
(3) E. Cambria, ‘Affective Computing and Sentiment Analysis’ IEEE Intell. Syst., vol. 31, no. 2, pp. 102–107, Mar. 2016.
(4) Mazhar Ali, and Asim Imdad Wagan. ‘Sentiment summerization and analysis of Sindhi text’ Int. J. Adv. Comput. Sci. Appl 8, no. 10 (2017): 296-300.
(5) B. Agarwal, S. Poria, N. Mittal, and A. Gelbukh, ‘Concept-level sentiment analysis with dependency-based semantic parsing: a novel approach’ Cognit. Comput., 2015.
(6) J. de Albornoz, L. Plaza, and P. Gervás, ‘SentiSense: An easily scalable concept-based affective lexicon for sentiment analysis.’ LREC, 2012.
(7) Denis, Alexandre, Samuel Cruz-Lara, and Nadia Bellalem. ‘General purpose textual sentiment analysis and emotion detection tools.’ arXiv preprint arXiv:1309.2853 (2013).
(8) T. Nasukawa and J. Yi, ‘Sentiment analysis’ in Proceedings of the international conference on Knowledge iscapture - K-CAP ’03, 2003, p. 70.
(9) M. Abdul-Mageed, M. Diab, and S. Kübler, ‘SAMAR: Subjectivity and sentiment analysis for Arabic social media’ Comput. Speech Lang., 2014.
(10) Dootio, Mazhar Ali, and Asim Imdad Wagan. ‘Syntactic parsing and supervised analysis of Sindhi text.’ Journal of King Saud University-Computer and Information Sciences 31, no. 1 (2019): 105-112.
(11) Dootio, M. A., & Wagan, A. I. (2019). ‘Development of Sindhi text corpus’ Journal of King Saud University-Computer and Information Sciences.
(12) Ali, M., & Wagan, A. I. (2019). ‘An analysis of sindhi annotated corpus using supervised machine learning methods’ Mehran University Research Journal of Engineering and Technology, 38(1), 185-196.
نوٽ: ھن مقالي ۾ تصويرون شامل آھن جنھن کي ڏسڻ لاءِ پي ڊي ايف ۾ مقالو کوليو
The modern age has connected people all over the globe through the internet and web 2.0, therefore, commodities, products, personalities, and people are turned in to global entities now. People, all over the globe, are showing and writing their opinions and suggestions for various types of products, commodities, personalities, etc. in their native / mother languages. The Sindhi language is spoken, written, and read all over the globe by Sindhi people, therefore, Sindhi people are also using the Sindhi language for writing and showing any type of comment, suggestion and opinion on any type of commodity, product, personality, politician, etc. Lots of research studies have been done on sentiment analysis of various text corpora of various languages of the world to get the polarity of opinions, views, thoughts, etc. which are given by individuals or groups. To analyse the opinionated text of Sindhi language for sentiment and emotions, there is a research problem because very little research work has been done on this issue so far. In order to resolve this issue of sentiment analysis for the Sindhi language, a research model is designed based on rule-based systems, algorithms, and methods. The model extracts the sentiments from the Sindhi text corpus and assesses those sentiments to get the sentiment polarity. In this regard, specific weights/scales have been assigned to every sentiment-based word. Therefore, assessment of weighted sentiment-based words creates the confidence level of polarity and gives a significant result. The results of sentiment analysis are shown in the form of positive, negative, and neutral polarity. The purpose of the current research study is to solve the natural language processing problems of the Sindhi language, especially the sentiment analysis problem and provide a research platform for future research. Therefore, the current study suggests more research work on Sindhi text corpus for aspect-based sentiment analysis using rule-based systems, machine learning, and deep learning models and algorithms.
Keywords: Sentiment Analysis; Opinionated text corpus; Sindhi language, Sentiment Polarity, NLP, Computational Linguistics.
تعارف: ڪنھن به سماج جي بناوٽ ۽ ان سماج ۾ رهندڙ ماڻهن جي حالتن، اخلاق، اٿڻي ويھڻي ۽ ريتن رسمن وغيره کي پرکڻ جو هڪ بھترين طريقو، ان سماج ۾ استعمال ٿيندڙ ٻوليءَ جي جاچ پڙتال آهي. ٻولي ماڻهن جي روين، ڪرتن ۽ معاشي حالتن وغيره بابت ٻڌائيندي آهي (1) اهڙيءَ ريت ٻولي، ماڻهن جي احساسن، جذبن، ڪيفيت ۽ مختلف وقتن تي سامهون ايندڙ راين بابت پڻ ڄاڻ ڏيندي آهي. ماڻهو پنھنجي ٻوليءَ ۾ ڳالهائڻ يا لکڻ وقت مختلف قسم جا نظريا، رايا يا خيال پيش ڪندا آهن. انهن نظرين، راين ۽ خيالن ۾ ماڻهن جي مختلف قسمن جا احساس ۽ جذبا شامل هوندا آهن، جن جي تمام گهڻي اهميت هوندي آهي. انهن جي احساسن ۽ جذبن جي بنياد تي ئي ڪنھن به فرد جي نظريي، خيال، رايي، لکڻيءَ يا ڳالهه کي پرکي سگهبو آهي يا ان جو تجزيو ڪري سگهبو آهي ته اهي نظريا، رايا، خيال، لکڻيون ۽ ڳالهيون مثبت آهن؛ منفي آهن يا غيرجانبدار. هن تحقيق جو مقصد اهو معلوم ڪرڻ آهي ته سنڌي ٻوليءَ ۾ لکجندڙ مواد ۾ ڪھڙي قسم جا احساس يا خيال موجود آهن ۽ انهن خيالن کي ڪمپيوٽر مشين، هٿراڌو ڏاهپ (Artificial intelligence) ذريعي ڪيئن سمجهي سگهي ٿي ۽ ڪھڙي طريقي سان ان مواد مان نتيجا ڪڍي سگهي ٿي. ان سان اهو معلوم ٿيندو ته ڪمپيوٽر ڪيترو سيڪڙو سنڌي ٻوليءَ کي سمجهي ٿو ۽ ڪيترو سيڪڙو درست نتيجا ڏئي ٿو. هن تحقيقي مطالعي ۾ سنڌي ٻوليءَ جي متن کي ڪمپيوٽيشنل لسانيات (Computational Linguistics) ۽ قدرتي ٻولين کي پروسيس (Natural Language Processing) ڪرڻ وارن اوزارن جي ذريعي پروسيس ڪيو ويو آهي ۽ نتيجا حاصل ڪيا ويا آهن.
1.1 مسئلي جو بيان ۽ تحقيق جو مقصد: ڪمپيوٽر مشين (Computer Machine) ذريعي احساسن جو تجزيو (Sentiment analysis) هڪ اهم ۽ پيچيده تحقيقي ڪم آهي. احساسن جو تجزيو انساني ٻولين جي پروسيس ۽ هٿراڌو ڏاهپ (Artificial Intelligence) جي شعبي ۾ اهم تحقيقي ڪم آهي، جيڪو دنيا جي ڪيترين ٻولين تي ٿي رهيو آهي. موجوده دور ۾ ڪن خاص اصولن جي بنياد تي (Rule-Based) ۽ ڪمپيوٽر مشين کي سکيا ڏيڻ (Machine learning) جي طريقن جي ذريعي، انساني ٻولين ۾ موجود لفظن يا جملن جي ڀنڊار (Corpus) جو تجزيو ڪيو وڃي ٿو، جنھن سان ماڻهن جي احساسن، ۽ راين جو تجزيو ڪيو وڃي ٿو، جنھن مان معلوم ٿئي ٿو ته ماڻهو لکڻ يا ڳالهائڻ وقت ڪيترا مثبت يا منفي رايا ڏين ٿا. اهڙي قسم جي تحقيق جو ادارن، ڪمپنين، وکرن، سياسي ۽ سماجي شخصتين وغيره کي تمام گهڻو فائدو پوي ٿو. سنڌي ٻوليءَ جي متن (Text) تي اڳ ۾ هن قسم جي تحقيق نه ٿيڻ جي ڪري، سنڌي متن مان اهو معلوم نه ڪري سگهبو هو ته ماڻهن جا ڪنھن به وکر يا شخصيت جي باري ۾ ڪھڙي قسم جا احساس يا رايا آهن يا هو عام رواجي گفتگؤَ ۾ ڪھڙي قسم جا رايا يا احساس پيش ڪن ٿا ۽ انهن جي قطبيت يا پولارٽي (polority) مثبت آهي يا منفي يا وري غير جانبدار(Nuteral). هي هڪ اهم تحقيقي مسئلو هو، جنھن کي حل ڪرڻ لاءِ هٿراڌو ڏاهپ جا ڪمپيوٽرائزڊ اوزار ۽ مشيني سکيا جا الگوريٿم ٺاهي، خودڪار نظام ذريعي سنڌي متن جو تجزيو ڪيو ويو آهي ۽ انهن تجزين ۽ نتيجن کي هن تحقيق ۾ شامل ڪيو ويو آهي.
هن مسئلي کي حل ڪرڻ جو مقصد سنڌي ٻوليءَ جي ڪنھن به متن ۾ موجود راين، تجويزن ۽ احساسن جي سطح (Level) ماپڻ ۽ معلوم ڪرڻ آهي ۽ انهن جي قطبيت (polority) ڪڍڻ آهي، جنھن سان سنڌي ٻولي دنيا جي ٻين ترقي ڪندڙ ٻولين جي سٿ ۾ شامل ٿيندي ۽ عالمگيريت جي دور ۾ انگريزي ٻولي وانگر پنھنجي مسئلن کي خودڪار ڪمپيوٽر نظام يا پروگرامن ذريعي پاڻ حل ڪري سگهندي. هيءَ تحقيق سنڌي ٻوليءَ جي متن (Text) تي وڌيڪ تحقيق ڪرڻ جا درواز پڻ کوليندي ته جيئن ڪمپيوٽر سائنس، انفرميشن ٽيڪنالاجي، هٿراڌو ڏاهپ ۽ ڪمپيوٽر سائنس سان واسطو رکندڙ ٻين شعبن جا شاگرد، استاد ۽ محقق وڌيڪ تحقيق ڪري سگهن.
1.2 احساسن جو تجزيو: ماڻهو پنھنجي مسئلن، راين، خيالن ۽ نظرين وغيره کي مختلف قسم جي لکڻين، ڳالهين، تقريرن، مشورن ۽ ڪچھرين وغيره ذريعي يا سماجي ميڊيا (2) جي پليٽفارم ذريعي پيش ڪن ٿا، اهڙي طرح ماڻهو مختلف قسم جي ادارن، تنظيمن، وکرن، فلمن، ڊرامن، ڪھاڻين، ناولن، شعرن، ڪتابن، ريتن رسمن، ثقافتن، ٻولين، سياستدانن، ۽ مختلف قسم جي سماجي ۽ سياسي مسئلن تي پنھنجا ويچار ۽ رايا پيش ڪن ٿا يا پنھنجي جذبن جو اظھار ڪن ٿا، جن ۾ انهن ماڻهن جا مختلف قسمن جا احساس شامل هوندا آهن. انهن احساسن، جذبن، راين، خيالن، ۽ نظرين وغيره جي تجزيي يا ڇيد کي احساسن جو تجزيو (Sentiment Analysis) چئبو آهي(3) .
احساسن جو تجزيو، ماڻهن جي راين ۽ خيالن کي ماپي، انهن جو خلاصو (Summary) پيش ڪري ٿو ، جنھن ۾ احساسن ۽ جذبن جي تجزيي جا مختلف قسمن مطابق نتيجا موجود هوندا آهن، جيڪي قطب بندي (Polarity) جي شڪل ۾ ظاهر ڪيا وڃن ٿا، مثال طور، مثبت (Positive) يا منفي (Negative)يا غيرجانبدار ) (Neutral قطبيت يا رايو .(4)
احساسن جي تجزيي ۾ راءِ (Opinion)جي تمام گهڻي اهميت هوندي آهي. راءِ ڏيڻ لاءِ راءِ ڏيندڙ، مفعول جنھن جي باري ۾ راءِ ڏني وڃي ۽ راءِ جي وجود جو هجڻ ضروري هوندو آهي. اهي ٽيئي عمل راءِ ڏيڻ واري عمل جا اهم حصا آهن، جن کي هيٺ مختصر طور بيان ڪجي ٿو.
1. راءِ ڏيندڙ(Opinion Holder) : ڪو به فرد يا ادارو، جيڪو ڪنھن به مفعول يا شيءِ (Object) تي راءِ ڏيڻ جو اهل آهي يا راءِ ڏيڻ جو حق رکي ٿو.
2. وکر يا مفعول (Object): ڪو به وکر، بيان، شخصيت يا ڪنھن به قسم جي لکت وغيره، جنھن تي راءِ ڏئي سگهجي
3. راءِ (Opinion): ڪو به خيال يا ويچار، جنھن ۾ ڪنھن به قسم جو احساس يا جذبو موجود هجي جيڪو ڪنھن به مفعول يا وکر وغيره جي باري ۾ پيش ڪجي ٿو يا مفعول يا وکر وغيره جي گڻ يا اوگڻ کي بيان ڪري.
شڪل 1: راءِ ڏيندڙ (Opinion Holder) ، راءِ (Opinion) ۽ مفعول ( Object) جنھن تي راءِ ڏجي ٿي، کي پيش ڪري ٿي.
مٿين راءِ ڏيڻ جي عمل کي شڪل نمبر 1 جي ذريعي ظاهر ڪجي ٿو. هن شڪل ۾ راءِ ڏيندڙ، راءِ ۽ مفعول يا وکر پيش ڪيا ويا آهن. هن شڪل ذريعي راءِ ڏيڻ جو عمل واضح ٿئي ٿو.
انٽرنيٽ ذريعي هلندڙ ويب Web 2.0کان اڳ ۾ ماڻهو ڪو به وکر وٺڻ لاءِ پنھنجي دوستن يا مائٽن وغيره کان رايا وٺندا هئا، پر هاڻي ماڻهو ان وکر جي ويبسائيٽ تي يا سماجي ميڊيا تي، ان وکر جي باري ۾ معلوم ڪن ٿا ۽ وکر کي استعمال ڪرڻ کانپوءِ، ان وکر تي راءِ ڏين ٿا. تنھنڪري ڪو به وکر وٺڻ يا سافٽويئر انسٽال ڪرڻ کان اڳ ۾ ماڻهن جا رايا ڏسجن ٿا، جن سان ان وکر جي اهميت جي خبر پئجي وڃي ٿي. انهن راين يا تجويزن ۾ ماڻهن جا جذبا ۽ احساس شامل هوندا آهن، جيڪي احساسن جي تجزيي واري نظام لاءِ اهم هوندا آهن. جذبن يا احساسن جو تجزيو هڪ عام عمل آهي، جيڪو جدا جدا وکرن (produscts) يا ادارن لاءِ ماڻهن جي رَوِش، راءِ، احساس ۽ خيال جو تجزيو ڪري ٿو. تنھنڪري، جذبن يا احساسن جو تجزيو ڪنھن هدف (Target) تي مبني هوندو آهي، ڇاڪاڻ ته ڪابه راءِ ڪنھن وکر کي نشانو بڻائي ڏني ويندي آهي. مثال طور: منھنجي ڪار جون سيٽون آرامده آهن، هتي صرف، ڪار جون سيٽون، راءِ ڏيندڙ جون هدف آهن، تنھنڪري راءِ ڏيندڙ، راءِ ڏيڻ جو وقت، راءِ ڏيڻ جي جاءِ، راءِ ڏيڻ يا احساس کي ظاهر ڪرڻ جو سبب ۽ راءِ يا خيال جو هدف اهم هوندا آهن. رايا يا احساس ٻولي يا ثقافت جي بنياد ، نفسيات جي بنياد، خريدار جي راءِ جي بنياد، وکر جي مختلف حصن يا خوبين جي بنياد، عقل جي بنياد، جذبن جي بنياد ، ۽ شعوري بنيادن تي ٿي سگهن ٿا، تنھنڪري جذبن يا احساسن جي قطب بندي (Polarity) مثبت، منفي ۽ غير جانبدار قسمن ۾ ظاهر ٿئي ٿي. هونءَ ته اسم ، صفت ، ظرف ۽ فعل وارا لفظ احساسن، راين ۽ خيالن وغيره جي پولارٽي يا قطب بنديءَ کي ظاهر ڪن ٿا، پر صفتن وارا لفظ ڪنھن عام راءِ واري متن جي قطبيت پيش ڪرڻ ۾ وڌيڪ عام ۽ اهم آهن.
قطبيت يا پولارٽي لاڳاپيل ماڻهن جي احساس ۽ راين بابت ڄاڻ ڏئي ٿي. پولارٽي جذبي يا احساس يا راءِ جي سطح (Level) تي ڀاڙيندي آهي. تنھنڪري، جذبي يا احساس يا راءِ جي پولارٽي، انهن جي اعتماد جي سطح تي بلند يا گهٽ ٿي سگهي ٿي. اهڙي طرح جذبن يا احساسن کي ماپڻ لاءِ انهن جي وزن يا ماپ جي پئماني (Scale) کي مقرر ڪيو وڃي ٿو، جيڪو جذبن يا احساسن جي مثبت يا منفي شدت ۽ ان شدت جي ماپ کي ظاهر ڪري ٿو. مثال طور: لفظ ٺيڪ، سٺو، بهتر ۽ بهترين جي شدت جي ماپ مختلف ٿيندي. اهڙي طرح مثبت وزن يا ماپ +1 کان +5 تائين ٿي سگهي ٿو ۽ منفي وزن يا ماپ کي وري ڪاٽو 1 کان ڪاٽو 5 جي ذريعي معلوم ڪري سگهجي ٿو. اهڙي قسم جي وزنن يا ماپن سان احساسن يا جذبن جي اعتماد جي سطح يا Confidence level معلوم ڪري سگهجي ٿي، جنھن به لفظ يا جملي جي مثبت يا منفي اعتماد جي سطح وڌيڪ هوندي ته اها ان لفظ يا جملي جي پولارٽي ٿيندي. اهڙيءَ ريت جيڪڏهن ڪنھن لفظ يا جملي جو وزن ٻڙي (Zero) هوندو يا ڪنهن به لفظ يا جملي جي پولارٽي نه مثبت هوندي ۽ نه ئي وري منفي هوندي، ته ان جملي يا لفظ جي پولارٽي غيرجانبدار (Neutral)ٿيندي.
احساسن جو تجزيو ڪيفيت، جذبن، مزاج، رَوِش، احساس ۽ ان سان گڏ خريدار جي پنھنجي خصلتن يا پيغام جي تحقيق جي اهم صفتن کي پرکڻ ۾ اهم ڪردار ادا ڪري ٿو (5). احساسن جو تجزيو ڪندڙ ڪمپيوٽر ايپليڪيشن موجوده قدرتي ٻولي جي پروسيس يا (Natural Language Processing) ۽ هٿراڌو ڏاهپ جي نظام جي بنياد تي ڪم ڪندڙ ڪمپيوٽرائزڊ ايپليڪيشن آهي، جيڪا ڪنھن به متن مان فاعلي (Subjective) متن کي دريافت ڪري، ان مان جذباتي ڪيفيتن يا جذبن يا راين ۽ احساسن کي جاچي، انهن جو تجزيو ڪري ٿي، اهڙي طرح جذبن يا احساسن جو تجزيو ڪري، انهن جي مثبت يا منفي قطبيت يا پولارٽي کي ظاهر ڪري ٿي (6)، مثال: ’انب مٺو آهي‘ هيءُ هڪ فاعلي (Subjective) جملو آهي، جنھن ۾ انب جي خصوصيت مٺِي ظاهر ڪئي وئي آهي، اها خصوصيت ان جملي جي مثبت پولارٽي (Polority) کي ظاهر ڪري ٿي. اهڙيءَ طرح ٻئي جملي ’صوف کٽو آهي‘ ۾ ’کٽو‘ صوف جي منفي خصوصيت کي ظاهر ڪري ٿو، تنھنڪري ان جملي جي پولارٽي (Polority)منفي ٿيندي. پر اهو ضروري نه آهي ته هر فاعلي (Subjective) جملو مثبت يا منفي پولارٽي ظاهر ڪري. مثال طور، آءٌ فلم ڏسان ٿو. هي جملو فاعلي (Subjective) ته آهي پر ان ۾ ڪنھن به قسم جو احساس يا رايو موجود نه آهي تنھنڪري ان جملي ۾ فلم جي مثبت يا منفي خصوصيت شامل نه آهي. انڪري ئي هن جملي جي پولارٽي مثبت يا منفي نه آهي. اهڙي قسم جي جملي کي غيرجانبدار (Nuteral) جملو چئبو، تنھنڪري ان جملي جي پولارٽي به غير جانبدار (Nuteral) ٿيندي.
2. تحقيق جو پسمنظر ۽ احوال: 1950ع کان پوءِ دنيا ۾ ٽيڪنالاجيءَ جي ترقي جي ڪري تمام گهڻيون تبديليون آيون آهن ۽ اڃا تائين اهي تبديلين اچڻ وارو عمل جاري آهي، جنھنڪري دنيا تيزيءَ سان ترقي ڪري رهي آهي. اهي تبديليون دنيا جي ساخت (Structure) کي به تبديل ڪري رهيون آهن. سن 2000ع کان پوءِ ته ٽيڪنالاجيءَ جي ترقي دنيا کي هڪ گلوب (Globe) ۾ تبديل ڪري ڇڏيو آهي. جيتوڻيڪ دنيا کي ان گلوب ۾ تبديل ڪرڻ جو سلسلو 1990ع کان پوءِ شروع ٿي چڪو هو . دنيا جو هڪ گولي يا گلوب ۾ تبديل ٿيڻ جي ڪري عالمگير سماج جڙڻ شروع ٿي ويو، جنھن پوري دنيا کي عالمي ڳوٺ (Globel village) ۾ تبديل ڪري ڇڏيو آهي. ان پوري عمل ۾ ٽيڪنالاجي، خاص ڪري انفرميشن ٽيڪنالاجيءَ جو اهم ڪردار رهيو آهي. عالمي ڳوٺ جڙڻ جي ڪري دنيا جي سمورين ٻولين جي اهميت به وڌي وئي آهي. موجوده دور ۾ ڪمپيوٽر ٽيڪنالاجيءَ مختلف ٻولين کي سمجهي رهي آهي ۽ انهن جو لسانياتي تجزيو ڪري رهي آهي ته جيئن ڄاڻ جي حصول (Information retrieval) ۽ ڳولا جي نظام (Search engines) کي بھتر ۽ آسان بڻائڻ سان گڏ مختلف ٻولين جي متن جو تجزيو(Text analysis) ۽ ترجمو ڪري سگهجي. ان سلسلي ۾ ڪمپيوٽر ٽيڪنالاجيءَ کي استعمال ڪندي، دنيا جي ٻولين جي مختلف پھلوئن، خاص ڪري صوتيات، نحو ۽ صرفيه تي گهڻو ڪم ٿي رهيو آهي. نحو ۽ صرفيه جي ڪري ڪنھن به ٻوليءَ جي متن جو ڇيد ڪري ان جي ساخت کي جاچيو وڃي ٿو ۽ ترجميڪاري، ڳولا جي نظام ۽ ڄاڻ جي حصول جي نظامن کي بھتر ڪيو وڃي ٿو. اهڙي طرح مختلف قسم جي متن جو تجزيو ڪري انهن ۾ موجود احساسن ۽ جذبن جو تجزيو ڪيو وڃي ٿو ته جيئن ماڻهن جي خيالن ۽ راين جي بھتر طريقي سان پرک ڪري سگهجي. متن جي بنياد تي جذبن جي سڃاڻپ ۽ احساسن جو تجزيو، جملن ۾ موجود جذبن ۽ احساسن جي موجودگي ۽ قطبيت کي ظاهر ڪن ٿا (7)
هن وقت دنيا جي ڪيترين ئي ٻولين ۾ موجود ڪارپس (لفظي ذخيري) تي احساسن جي تجزيي جي حوالي سان تحقيق ڪئي وڃي ٿي. جذبن يا احساسن جي تجزيي تي پھريون تحقيقي مطالعو 2003ع ۾ پيش ڪيو ويو.(8) جذبي جي چڪاس ۽ تجزيي تي اڪثر ڪري تحقيق انگريزي ٻولي جي متن تي ڪئي وئي آهي (9)، (10) پر هن وقت دنيا جي ڪيترين ئي ٻولين تي ان قسم جي تحقيق گهڻي تعداد ۾ ٿي رهي آهي. انهن ٻولين ۾ سنڌي ٻولي به شامل آهي. ان سلسلي ۾ سنڌي ٻوليءَ جو ڪارپس (corpus) ٺاهي، ان جي مختلف پھلوئن تي تحقيق ڪئي وئي آهي، جنھن مان سنڌي ٻولي جي ساخت ۽ احاطي (Domain)، قد ڪاٺ ۽ بيهڪ وغيره جي خبر پوي ٿي (11). سنڌي ٻوليءَ جي ڪارپس جي بنياد تي صرفيه ۽ نحو سان گڏ احساسن جي تجزيي تي پڻ تحقيق ٿي رهي آهي، جيڪا ڪيترن ئي قومي ۽ بين الاقوامي تحقيقي جرنلس ۾ ڇپجي چڪي آهي(12). سنڌي ٻوليءَ جي متن يا ڪارپس ۾ موجود احساسن، جذبن، راين ۽ تجويزن تي ٿيندڙ هي تحقيق اڳين تحقيق جي هڪ ڪڙي آهي، جنھن ذريعي سنڌي ٻوليءَ جي ڪارپس کي ڪمپيوٽر مشين جي هٿراڌو ڏاهپ جي اوزارن (Artificial Intelligence Applications) جي ذريعي تجزيو ڪري احساسن يا جذبن يا راين وغيره جي پولارٽي ڪڍي وڃي ٿي ۽ انهن جو تجزيو ڪري ان جو تتُ/ خلاصو پيش ڪيو وڃي ٿو.
3. طريقيڪار: هيءَ هڪ تجرباتي تحقيق آهي، جنھن ذريعي ماڻهن جي ويچارن، رويَن، تجويزن، نظرين ۽ قياس آرائين وغيره کي ڪمپيوٽرائزڊ الگوريٿم، ڊيٽا اسٽرڪچرس ۽ هٿراڌو ڏاهپ جي اصولن ۽ ايجنٽس جي بنياد تي حل ڪيو ويو آهي. سنڌي ٻوليءَ لاءِ هٿراڌو ڏاهپ جي بنياد تي مخصوص قسم جون ڪمپيوٽرائزڊ ايپليڪيشن ٺاهيون ويون آهن، جيڪي سنڌي متن جو گرامر جي بنياد تي ڇيد ڪري، ان جو تجزيو ڪن ٿيون، جنھن ذريعي اهو معلوم ٿئي ٿو ته راءِ ڏيندڙ ڪھڙي وکر(product)، شخصيت يا ڪنھن شيءِ يا مفعول لاءِ ، ڪھڙي قسم جي راءِ ڏئي ٿو ۽ ان راءِ ۾ ان جا ڪھڙي قسم جا جذبا ۽ احساس شامل آهن. شڪل 2 احساسن کي ڳولڻ ۽ انهن جي پولارٽي ڪڍڻ جي تحقيقي طريقيڪار کي بيان ڪري ٿي.
شڪل 2: احساسن کي ڳولڻ ۽ انهن جي پولارٽي ڪڍڻ جو تحقيقي طريقيڪار
ڪنھن به تحقيق لاءِ مسئلي جو هجڻ ۽ ان مسئلي کي سمجهڻ ضروري هوندو آهي. مسئلي کي سمجهڻ سان ئي تحقيقي سوال، تحقيق جا مول ۽ متا ۽ مقصد بيان ڪري سگهبا آهن. تنھنڪري، هي تحقيق ڪرڻ لاءِ سڀ کان پھريان مسئلي کي ڳوليو ويو ۽ ان کي مختلف تحقيقي رخن کان پرکيو ۽ سمجهيو ويو. مسئلي کي حل ڪرڻ لاءِ گهربل مواد سماجي ميڊيا جي اوزارن يا ايپليڪيشنس، سنڌ سلامت آنلائين ڪتاب گهر تي موجود ڪتابن ۽ گوگل فارم جي ذريعي حاصل ڪئي وئي آهي. حاصل ٿيل متن کي هڪ ڪارپس يا جملن جي ڀنڊار جي شڪل ڏني وئي.
اهڙيءَ طرح، انهن جملن کي سنڌي ٻوليءَ لاءِ ٺاهيل احساسن جي تجزيي واري ڪمپيوٽرائزڊ نظام (Sentiment Analysis System For Sindhi Language) ۾ پروسيس ڪيو ويو ۽ گهربل نتيجا حاصل ڪيا ويا، جيڪي هن مقالي جي نتيجن واري حصي ۾ رکيا ويا آهن. سنڌي ٻوليءَ جي متن ۾ موجود احساسن کي جاچڻ واري نظام کي ٺاهڻ لاءِ هڪ خاص الگوريٿم ۽ ڊيٽا اسٽرڪچر جي بنياد تي ڪمپيوٽرائزڊ ماڊل ٺاهيو ويو آهي، جيڪو سنڌي متن کي سمجهي، ان مان نتيجا اخذ ڪري ٿو. اهو ماڊل هيٺينءَ ريت ڪم ڪري ٿو:
1. سنڌي متن يا جملي کي پڙهي ٿو.
2. سنڌي جملي کي کاٻي کان ساڄي طرف آڻي، ان جي لکت کي ساڄي طرف کان شروع ڪري ٿو (ان لاءِ هڪ لُوپ (Loop)، جنھن کي وائيل لوپ (while loop) چئجي، ٿو سو هلايو وڃي ٿو، جيڪو سنڌي جملي کي عربي-فارسي ’عريبڪ پرشيا‘ جي لپيءَ مطابق ساڄي پاسي کان لکي ٿو)
3. سنڌي جملي جي ڀاڃ ڪري، ان کي جدا جدا لفظن ۾ پيش ڪري ٿو (ڀاڃ جو جدا الگوريٿم ٺاهيو ويو آهي، جيڪو هن ماڊل ۾ هڪ خاص عمل ذريعي گهرايو وڃي ٿو)
4. ڀاڃ ذريعي جدا ڪيل لفظن، نشانين ۽ پوري دم کي عالمي گرامر ۽ سنڌي گرامر تحت نشان لڳايو وڃي ٿو (نشان لڳائڻ جو نظام هڪ خاص الگوريٿم ۽ ڊيٽا اسٽرڪچر تحت ٺاهيو ويو آهي جيڪو هڪ خاص عمل ذريعي گهرايو ويو آهي.)
5. جيڪڏهن پروسيسر اهو سڀ ڪجهه سمجهي وڃي ٿو ته پوءِ هو سنڌي متن ۾ موجود احساس کي ڳولي، انهن کي مثبت ۽ منفي وزن ڏئي ٿو. (ان پروسيس لاءِ هڪ الڳ لُوپ هلي ٿو، جنھن کي فار لوپ (For loop) چئجي ٿو)
6. اهو لوپ احساس وارا لفظ ڳولي، انهن کي وزن ڏئي الڳ لڳ رکندو وڃي ٿو ۽ آخر ۾ مثبت ۽ منفي وزنن وارن لفظن کي جدا جدا توري ٿو، جنھن جو وزن وڌيڪ هوندو ان جي قطبيت يا پولارٽي کي بيان ڪندو. اهڙيءَ طرح ٺلهن واري چارٽ (Bar Chart) جي بنياد تي هڪ خلاصو (Visual Summary) ظاهر ڪندو، جنھن ۾ جملي جي قطبيت بيان ٿيل هوندي.
7. جيڪڏهن جملي ۾ ڪنھن به قسم جي قطبيت موجود نه آهي ته اهو غير جانبدار neutral جملو هوندو.
8. جيڪڏهن جملي ۾ مثبت ۽ منفي قطبيت يا پولارٽي وارا لفظ هڪ جيترا هوندا ته اهو جملو گاڏڙ ساڏڙ يا گڏيل قطبيت (Mix Polarity)وارو جملو ٿيندو
9. هي عمل هر جملي لاءِ ورجائبو رهبو.
4. نتيجا ۽ بحث:
تحقيق جا نتيجا تحقيق جي طريقيڪار، تحقيق جي ماڊل، تحقيق جي سوالن ۽ تحقيق جي مقصد جي بنياد تي ڪڍيا ويندا آهن تنھنڪري هن تحقيق ۾ جيڪي نتيجا بيان ڪيا وڃن ٿا، سي تحقيق جي مسئلي، تحقيقي سوالن ۽ تحقيق جي مقصد جي بنياد ۽ تحقيق جي طريقيڪار ۽ تحقيقي ماڊل جي بنياد تي پيش ڪيا وڃن ٿا، جيڪي هيٺ مخلتف شڪلن ۽ جدولن جي صورت ۾ بيان ڪيا
ويا آهن. هي سمورا نتيجا هٿراڌو ڏاهپ جي بنياد تي ٺاهيل ڪمپيوٽرائزڊ پروگرام https://sindhinlp.com/sentiment.php (جيڪو سنڌي ٻوليءَ لاءِ مٿي بيان ڪيل الگوريٿم (Algorithm) جي بنياد تي ٺاهيل ماڊل ذريعي ٺاهيو ويو آهي) ذريعي ڪڍيا ويا آهن، تنھنڪري هي نتيجا هڪ خودڪار نظام ذريعي اخذ ٿيل آهن، جنھن ۾ ڪنھن انساني راءِ جي شموليت نه آهي.
سنڌي ٻوليءَ جي ٺاهيل ڪارپس مان مختلف قسم جا جملا ڪڍي، انهن کي سنڌي ٻوليءَ جي احساسن کي ماپڻ واري نظام ۾ پروسس ڪري نتيجا حاصل ڪيا ويا آهن. سنڌي ڪارپس مان هڪ جملو ’سنڌي ٻولي دنيا جي پراڻي ٻولي آهي‘ احساسن کي ماپڻ واري نظام ۾ پروسس ڪري، جملي جو تجزيو ڪيو ويو. جدول 1 سنڌي جملي کي خودڪار نظام ذريعي ڪيل ڇيد جا نتيجا ظاهر ڪري ٿي، جنھن مان جملي ۾ موجود راين ۽ احساسن جي خبر پوي ٿي. جملي ۾ صفت وارو لفظ ’پراڻي‘ ٻوليءَ جي باري ۾ راءِ ۽ ان ۾ موجود احساس کي ظاهر ڪري ٿو. گرامري ڇيد سان راءِ ۽ احساس رکندڙ لفظ معلوم ٿين ٿا.
جدول 1: سنڌي جملي ’سنڌي ٻولي دنيا جي پراڻي ٻولي آهي‘ جو عالمي ۽ سنڌي گرائمر جي ڳالهائڻ جي لفظن مطابق لڳايل نشانن کي ظاهر ڪري ٿي.
سنڌي ڳالهائڻ جو نشان عالمي ڳالهائڻ جو نشان سنڌي لفظ
اسم خاص PROPN سنڌي
اسم NOUN ٻولي
اسم NOUN دنيا
حرفِ جر ADP جي
صفت ADJ پراڻي
اسم NOUN ٻولي
فعل معاون AUX آهي
جدول 1 ۾ 7 لفظ موجود آهن، جن ۾ صرف هڪ لفظ ’پراڻي‘ سنڌي ٻوليءَ بابت راءِ کي ظاهر ڪري ٿو ۽ ان ۾ هڪ احساس موجود آهي، جيڪو سنڌي ٻوليءَ جي حيثيت کي ظاهر ڪري رهيو آهي. شڪل 3 ’سنڌي ٻولي دنيا جي پراڻي ٻولي آهي‘ جو تجزيو پيش ڪري ٿي ۽ جملي ۾ موجود احساس جي پولارٽي کي ظاهر ڪري ٿي.
شڪل 3: سنڌي جملي’سنڌي ٻولي دنيا جي پراڻي ٻولي آهي‘ ۾ موجود احساسن جو تجزيو پيش ڪري ٿي ۽ جملي جو نتيجو مثبت قطبيت ۾ ظاهر ڪري ٿي.
’سنڌي ٻولي دنيا جي پراڻي ٻولي آهي‘ ۾ موجود احساسن جو تجزيو جملي جي مثبت پولارٽي يا قطبيت کي ظاهر ڪري ٿي. هي شڪل ڪمپيوٽر جي پاڻمرادي يا خودڪار نظام ذريعي حاصل ڪئي وئي آهي. هي نظام احساسن جو وزن ڪري، انهن کي قطبيت جي بنياد تي جدا ڪري، انهن جو جوڙ ڪري ٿو ۽ ان جي ميزان يا ٽوٽل جي بنياد تي اعتماد جي لڪير يا اعتماد جي سطح بيان ڪري ٿو. اهڙيءَ طرح جنھن قطبيت يا پولارٽيءَ جو وزن وڌيڪ ٿيندو، ان جي اعتماد جي سطح به وڌندي. هن جملي جي تجزيي ۾ مثبت قطبيت جي اعتماد جي سطح وڌيڪ آهي، تنھنڪري هن جملي جي قطبيت يا پولارٽي مثبت آهي. جيتوڻيڪ ڪن جملن ۾ پراڻي يا پراڻو لفظ منفي قطبيت کي ظاهر ڪندو آهي، مثال طور هي گهر پراڻو آهي. هتي لفظ پراڻو جو مطلب منفي آهي، ڇاڪاڻ ته ان سان صفت ’پراڻو‘ اسم ’گهر‘ جي اوَگڻ کي ظاهر ڪري ٿي.
احساسن جي تجزيي جي پاڻمرادي/خودڪار نظام ۾ هڪ ٻيو سنڌي جملو ’اسلم جيڪي انب موڪليا سي خراب هئا‘ پروسيس ڪيو ويو . جدول 2 ان جملي جو عالمي ۽ سنڌي گرامر جي ڳالهائڻ جي لفظن مطابق ڇيد ڪري ٿي، جنھن مان خبر پوي ٿي ته جملي ۾ ڪھڙا لفظ اسم، صفت، ظرف ۽ فعل آهن، اهڙن لفظن جي بنياد تي جملي جو احساساتي تجزيو ڪيو وڃي ٿو.
جدول 2 سنڌي جملي ” اسلم جيڪي انب موڪليا سي خراب هئا“ کي عالمي ۽ سنڌي گرامر جي ڳالهائڻ جي لفظن مطابق لڳايل نشانن کي ظاهر ڪري ٿي.
سنڌي ڳالهائڻ جو نشان عالمي ڳالهائڻ جو نشان سنڌي لفظ
اسم خاص PROPN اسلم
ضمير اشارو DET جيڪي
اسم NOUN انب
فعل VERB موڪليا
ضمير اشارو DET سي
صفت ADJ خراب
فعل VERB هئا
جدول 2 ۾ سنڌي جملي’ اسلم جيڪي انب موڪليا سي خراب هئا‘ جا ست لفظ موجود آهن، جن ۾ هڪ لفظ ’خراب‘ صفت آهي. جڏهن ته ٻيا لفظ صفت نه آهن، جيڪي انبن جو وجود، ساخت ۽ ذائقي کي ته ظاهر ڪن ٿا، پر اهي انبن جا گڻ يا اوگڻ به ٻڌائين ٿا. شڪل 4 سنڌي جملي ’اسلم جيڪي انب موڪليا سي خراب هئا‘ جو تجزيو پيش ڪري ٿي ۽ جملي ۾ موجود احساسن جي پولارٽيءَ کي ظاهر ڪري ٿي. هن جملي ۾ صفت-خراب، اسم-انب، جا اوگڻ بيان ڪري ٿي، جنھنڪري ان لفظ جو وزن به منفي ٿئي ٿو. خودڪار نظام سمورن لفظن کي جاچي ٿو ۽ صفت خراب جي منفي وزن جي بنياد تي اعتماد جي سطح ٺاهي ٿو، جنھن بنياد تي جملي جي قبطبيت يا پولارٽيءَ کي بيان ڪري ٿو. احساسن جي تجزيي وارو ڪمپيوٽرائزڊ نظام جملي ’اسلم جيڪي انب موڪليا سي خراب هئا‘ جي تجزيي ۾ جملي جي منفي قطبيت جي اعتماد جي مٿين سطح ۽ مثبت قطبيت جي 0 سطح جي بنياد تي نتيجو منفي ظاهر ڪري ٿو.
شڪل 4 سنڌي جملي ’ اسلم جيڪي انب موڪليا سي خراب هئا‘ جو تجزيو پيش ڪري ٿي ۽ جملي ۾ موجود احساس جي پولارٽيءَ کي منفي ظاهر ڪري ٿي.
سنڌي جملو ’آئون فلم ڏسان ٿو‘ احساسن جي تجزيي واري پاڻمرادي يا خودڪار ڪمپيوٽرائزڊ پروگرام ۾ پروسيس ڪيو ويو، جنھن جي ڀاڃ ڪرڻ کانپوءِ سنڌي گرامر ۽ عالمي گرامر جي ڳالهائڻ جي لفظن مطابق نشان لڳايا ويا آهن. جدول 3 سمورن لفظن کي گرامر جي لفظن مطابق نشان لڳائي جدا جدا ظاهر ڪري ٿي.
جدول3: سنڌي جملي ’آئون فلم ڏسان ٿو‘ کي عالمي ۽ سنڌي گرامر جي ڳالهائڻ جي لفظن مطابق لڳايل نشانن کي ظاهر ڪري ٿي:
سنڌي ڳالهائڻ جو نشان عالمي ڳالهائڻ جو نشان سنڌي لفظ
ضمير PRON آئون
اسم NOUN فلم
فعل VERB ڏسان
فعل VERB ٿو
جدول 3 ۾ چار لفظ بيان ڪيل آهن، جن ۾ اسم يا فعل ڪنھن به راءِ يا تجويز وغيره کي ظاهر نه پيا ڪن. نه ئي وري ڪا صفت موجود آهي جيڪا اسم يا ضمير جو گڻ يا اوگڻ بيان ڪري. تنھنڪري ’آءٌ فلم ڏسان ٿو‘ جملي ۾ مثبت يا منفي قطبيت نظر ڪون اچي پئي. شڪل 5 ۾ احساسن جي تجزيي ۽ خلاصي کي ظاهر ڪيو ويو آهي. ان شڪل مطابق مثبت ۽ منفي لفظن جو وزن 0 ٻُڙي آهي، جيڪا ڪنھن به قسم جي مثبت يا منفي اعتماد جي سطح کي ظاهر نه پئي ڪري، تنھنڪري سنڌي جملي ’آءٌ فلم ڏسان ٿو‘ جو نتيجو غير جانبدار (Neutral) قطبيت يا پولارٽي آهي. ان جو مطلب ٿيو ته جملو ته فاعلي آهي، پر ان ۾ موجود مفعول ڪنھن به قسم جي تجويز يا راءِ کي ظاهر نه پيو ڪري، جنھن ۾ احساس موجود هجي. اهڙي قسم جي جملن جو تجزيو هميشه غير جانبدار پولارٽي يا قطبيت کي ظاهر ڪري ٿو.
شڪل 5 سنڌي جملي ’آءٌ فلم ڏسان ٿو‘ جو تجزيو پيش ڪري ٿي ۽ جملي ۾ موجود احساس جي پولارٽيءَ کي غير جانبدار ظاهر ڪري ٿي.
ساڳئي جملي ۾ جيڪڏهن ڪو صفت وارو لفظ شامل ڪريو، جيڪو اسم ’فلم‘ جو گڻ يا اوگڻ بيان ڪري ته جملي جو نتيجو تبديل ٿي ويندو. مثال ساڳئي جملي ۾ لفظ ’سٺي‘ جو اضافو ڪجي ته جملي جو نتيجو مَٽجي ويندو. ڇاڪاڻ ته لفظ سٺي، جملي ۾ موجود لفظ ’فلم‘ جو گڻ بيان ڪري ٿو، تنھنڪري جملي جي احساسن واري قطبيت به تبديل ٿي ويندي. جدول 4 سنڌي جملي ’مان سٺي فلم ڏسان ٿو‘ جو سنڌي ۽ عالمي گرامر مطابق ڇيد پيش ڪري ٿي، جنھن سان خبر پوندي ته ڪھڙو لفظ هڪ سٺو احساس پيش ڪري ٿو.
جدول 4 سنڌي جملي ’آءٌ سٺي فلم ڏسان ٿو‘ کي عالمي ۽ سنڌي گرامر جي ڳالهائڻ جي لفظن مطابق لڳايل نشانن کي ظاهر ڪري ٿي
سنڌي ڳالهائڻ جو نشان عالمي ڳالهائڻ جو نشان سنڌي لفظ
ضمير PRON آئون
صفت ADJ سٺي
اسم NOUN فلم
فعل VERB ڏسان
فعل VERB ٿو
جدول 4 ۾ جملي ’آئون سٺي فلم ڏسان ٿو‘ ۾ لفظ ’سٺي‘ جيڪو صفت آهي، سا اسم واري لفظ ’فلم‘ جو گڻ پيش ڪري ٿي، جنھن سان مثبت احساس پيدا ٿئي ٿو ۽ جملي جو نتيجو تبديل ٿئي ٿو. جملي ۾ موجود لفظ ’سٺي‘ جو وزن مثبت نشان سان ظاهر ٿئي ٿو، تنھنڪري جملي جو خودڪار ڪمپيوٽرائزڊ نظام ذريعي تجزيو به مثبت ٿئي ٿو. شڪل 6 جملي جو ڪمپيوٽرائزڊ خلاصو پيش ڪري ٿو، جنھن مان جملي جي مثبت قطبيت نظر اچي ٿي.
شڪل 6 سنڌي جملي ’ آئون سٺي فلم ڏسان ٿو‘ جو تجزيو پيش ڪري ٿي ۽ جملي ۾ موجود احساس جي پولارٽي کي مثبت ظاهر ڪري ٿي.
5. تحقيق جو حاصل مقصد:
ڪا به تحقيق ڪرڻ لاءِ ڪا حد (Limitation) مقرر ڪئي ويندي آهي، جيڪا تحقيق جي دائري کي ظاهر ڪندي آهي. تنھنڪري هيءَ تحقيق جيڪا هڪ خاص مسئلي جي بنياد تي ڪئي وئي آهي، ان به جي حد (Limitation) مقرر ٿيل آهي ۽ اُن حد جي اندر ئي تحقيقي ڪم ڪيو ويو آهي. تحقيقي مسئلي ۾ ظاهر ڪيو ويو آهي ته سنڌي ٻوليءَ ۾ بيان ڪيل تجويزين، راين، نظرين ۽ قياس آراين وغيره ۾ موجود مختلف قسم جي احساسن جو تجزيو ڪري، قطبيت معلوم ڪجي ته جيئن خبر پوي ته اهي احساس مثبت آهن يا منفي يا غيرجابندار. ان مسئلي جي بنياد تي هڪ خاص ماڊل ۽ تحقيق جو طريقيڪار بيان ڪيو ويو آهي، جنھن جي بنياد تي هڪ ڪمپيوٽرائزڊ خودڪار نظام ٺاهيو ويو آهي، جيڪو سنڌي جملن جي ڀنڊار جو تجزيو ڪري نتيجا ظاهر ڪري ٿو. هي نظام جملي کي جاچي، ان جي ڀاڃ ڪري ۽ ان جو ڇيد ڪري ٿو، جنھن سان معلوم ٿئي ٿو ته پاڻمرادي يا خودڪار نظام جي ڪم ڪرڻ جي صلاحيت درست ۽ برابر آهي. نتيجن جي درستگيءَ ماڊل جي درستگي کي ظاهر ڪري ٿي ۽ ان کي قابل بڻائي ٿي ته مستقبل ۾ وڌيڪ جملن يا متن کي ان خودڪار نظام ۾ پروسيس ڪري، احساسن جي تجزيي جا نتيجا اخذ ڪري سگهجن ٿا. نتيجن ۽ قطبيت جي بنياد تي فرد، خاندان، شخصيتون ۽ ادارا وغيره درست ۽ ڏُور رَس فيصلا ڪري سگهن ٿا، جنھن سان مستقبل ۾ ادارن جي ڪارڪردگي بھتر ڪري سگهجي ٿو. نتيجن واري باب ۾ جيڪي نتيجا ۽ انهن جا تجزيا پيش ڪيا ويا آهن، سي مختلف جملن جي بنياد تي حاصل ڪيا ويا آهن، جيڪي جدولن ۽ شڪلن جي صورت ۾ پيش ڪيا ويا آهن. نتيجا درست قطبيت کي ظاهر ڪن ٿا، جيڪي تحقيق جي مسئلي ۽ مقصد مطابق آهن. هي تحقيق سنڌي ٻوليءَ ۾ ٿيندڙ تحقيق (جيڪا ڪمپيوٽر ۽ هٿراڌو ڏاهپ جي بنياد تي ڪئي وئي آهي) ۾ هڪ نئين عنوان ۽ موضوع جو واڌارو ڪري ٿي، جنھن سان مستقبل ۾ ٿيندڙ تحقيق جا درواز کلندا.
جيتوڻيڪ موجوده تحقيق سنڌي ٻوليءَ جي متن ۾ موجود احساسن جو تجزيو ڪري قطبيت (Polority)جي بنياد تي خودڪار ڪمپيوٽرائزڊ نظام جي ذريعي نتيجا ظاهر ڪري، سنڌي ٻوليءَ ۾ لکجندڙ راين، تجويزن، خيالن، قياس آراين ۽ نظرين وغيره ۾ موجود احساسن کي مثبت، منفي يا غيرجانبدار قطبيت يا درجن يا زمرن ۾ ظاهر ڪري ٿي، تنھن هوندي به مستقبل ۾ ڪمپيوٽر يا هٿراڌو ڏاهپ جا نوان طريقا يا الگوريٿم کڻي، انهن کي سنڌي ٻوليءَ تي لاڳو ڪري، مختلف ۽ نوان نتيجا حاصل ڪري سگهجن ٿا. ان سان سنڌي ٻولي ۽ ان ۾ ٿيندڙ تحقيق جي ترقي ٿيندي.
حوالا
(1) ڏوتيو، مظھر علي ’عالمگيريت ۽ سنڌي سماج‘، پيڪاڪ پبلشرز ڪراچي سنڌ (2020)، ISBN 978-969-791439-5
(2)E. W. T. Ngai, S. S. C. Tao, and K. K. L. Moon, “Social media research: Theories, constructs, and conceptual frameworks,” Int. J. Inf. Manage., vol. 35, no. 1, pp. 33–44, Feb. 2015.
(3) E. Cambria, ‘Affective Computing and Sentiment Analysis’ IEEE Intell. Syst., vol. 31, no. 2, pp. 102–107, Mar. 2016.
(4) Mazhar Ali, and Asim Imdad Wagan. ‘Sentiment summerization and analysis of Sindhi text’ Int. J. Adv. Comput. Sci. Appl 8, no. 10 (2017): 296-300.
(5) B. Agarwal, S. Poria, N. Mittal, and A. Gelbukh, ‘Concept-level sentiment analysis with dependency-based semantic parsing: a novel approach’ Cognit. Comput., 2015.
(6) J. de Albornoz, L. Plaza, and P. Gervás, ‘SentiSense: An easily scalable concept-based affective lexicon for sentiment analysis.’ LREC, 2012.
(7) Denis, Alexandre, Samuel Cruz-Lara, and Nadia Bellalem. ‘General purpose textual sentiment analysis and emotion detection tools.’ arXiv preprint arXiv:1309.2853 (2013).
(8) T. Nasukawa and J. Yi, ‘Sentiment analysis’ in Proceedings of the international conference on Knowledge iscapture - K-CAP ’03, 2003, p. 70.
(9) M. Abdul-Mageed, M. Diab, and S. Kübler, ‘SAMAR: Subjectivity and sentiment analysis for Arabic social media’ Comput. Speech Lang., 2014.
(10) Dootio, Mazhar Ali, and Asim Imdad Wagan. ‘Syntactic parsing and supervised analysis of Sindhi text.’ Journal of King Saud University-Computer and Information Sciences 31, no. 1 (2019): 105-112.
(11) Dootio, M. A., & Wagan, A. I. (2019). ‘Development of Sindhi text corpus’ Journal of King Saud University-Computer and Information Sciences.
(12) Ali, M., & Wagan, A. I. (2019). ‘An analysis of sindhi annotated corpus using supervised machine learning methods’ Mehran University Research Journal of Engineering and Technology, 38(1), 185-196.
نوٽ: ھن مقالي ۾ تصويرون شامل آھن جنھن کي ڏسڻ لاءِ پي ڊي ايف ۾ مقالو کوليو