وبلاگ

توضیح وبلاگ من

پایان نامه ارشد رشته فناوری اطلاعات: رهیافتی برای نظرکاوی در متون خبری فارسی

 
تاریخ: 07-11-99
نویسنده: نویسنده محمدی

و ضرورت تحقیق

 

اطلاع از نظر دیگران از نقطه‌نظرات گوناگون دارای اهمیت فراوانی است. تصور کنید که قصد دارید کالا یا خدماتی را خریداری کنید. آگاهی از نظر مثبت یا منفی افرادی که قبلا آن کالا یا خدمات را خریداری کرده‌اند چقدر برای شما اهمیت دارد؟ آیا نظر آن‌ ها می‌تواند بر تصمیم شما تاثیر‌گذار باشد؟ اگر یک شرکت خدماتی داشتید به چه میزان علاقه‌مند به اطلاع از نظر مخاطبین خود در رابطه با مطلوبیت یا عدم مطلوبیت خدمات خود بودید؟ آیا اطلاع از نظر آن‌ ها در اتخاذ تصمیمات بهتر به شما کمک می‌کرد؟ اگر یک کاندیدای انتخاباتی بودید تمایل داشتید تا از اقبال یا عدم اقبال رای‌دهندگان نسبت به خود خبر داشته باشید؟

 

اگر به اطرافمان نگاه کنیم می‌بینیم که افراد حقیقی و حقوقی گوناگون از شرکت‌های بزرگ و سیاستمداران گرفته، تا افراد عادی جامعه در تصمیمات کوچک و بزرگ خود تحت تاثیر نظرات دیگران قرار دارند. طبیعتاً در چنین وضعیتی اطلاع از نظرات افراد اهمیت فراوانی پیدا می‌کند.

 

از طرف دیگر با ظهور وب و گسترش مشارکت کاربران در سال‌های اخیر به‌ خصوص با ظهور پدیده‌هایی مثل وبلاگ‌ها[1] و شبکه‌های اجتماعی[2]، و تمایل کاربران برای اظهار و به اشتراک‌گذاری نظرات خود پیرامون مسائل مختلف، شاهد حجم انبوهی از نظرات مکتوبی هستیم که هرگز تاکنون با این حجم، تنوع، و آسانی در دسترس قرار نداشته‌اند. این موضوع به‌همراه اهمیت ذکر‌شده در مورد اطلاع از نظر دیگران توجه محققین علوم کامپیوتر بویژه محققین حوزه‌ی داده‌کاوی[3] را به‌خود جلب کرده است و موجب شکل‌گیری حوزه‌ای جدید تحت عنوان “کاوش در نظرات[4]” گردیده است. بر اساس [1] شاید بتوان سال 2001 میلادی را نقطه‌ی عطفی برای این توجهات دانست.

 

به زمان ابعاد گوناگون جدیدی در حوزه‌ی کاوش در نظرات نمایان گشتند و تحقیقات متنوعی در رابطه با هر یک از این ابعاد شکل گرفتند. به عنوان نمونه نیاز به اطلاع از هویت و مشخصات شخصی که یک نظر را اظهار کرده است مثلا برای تعیین میزان سودمندی آن اظهار نظر، و یا نیاز به تشخیص نظراتی که برای اهداف نامطلوب (از قبیل تبلیغات جهت‌دار به‌نفع یا بر‌علیه یک کالا) درج شده‌اند از جمله‌ی این ابعاد هستند. ی بر تحقیقات انجام‌شده در حوزه‌ی کاوش در نظرات را می‌توان در [1] و [2] دید. در فصل دو به معرفی ابعاد گوناگون این حوزه و نیز چالش‌های مشترک این حوزه با حوزه‌های دیگر متن‌کاوی[5] (نظیر قطعه‌بندی متن[6] و برچسب زدن اجزاء گفتار[7]) خواهیم پرداخت.

 

وقتی شخصی در رابطه با چیزی نظری را بیان می‌کند، این نظر می‌تواند حاوی ویژگی‌های احساسی نظیر خشم، ترس، خوشحالی، و … باشد. از جمله‌ی ویژگی‌های احساسی موجود در نظرات که از مهمترین و اولیه‌ترین بحث‌هایی بوده که در حوزه‌ی کاوش در نظرات مطرح بوده است، گرایش یا به عبارت دیگر مثبت یا منفی بودن نظر اظهار‌شده در مورد هدف اظهار‌نظر است. از تشخیص این ویژگی احساسی در ادبیات این حوزه تحت عناوین “رده‌بندی احساس[8]”، “تحلیل احساس[9]”، “تشخیص قطبیت احساس[10]”، و “تشخیص گرایش احساس[11]” یاد می‌شود. برای مثال اظهار‌نظر “تصویر این تلویزیون خیلی با کیفیت است” حاوی احساس مثبت نسبت به کیفیت تصویر تلویزیون است و در طبقه‌بندی مثبت قرار می‌گیرد، و اظهار‌نظر “تماشای این فیلم را به کسی توصیه نمی‌کنم” حاوی احساس منفی نسبت به فیلم مورد نظر است.

 

آگاهی از “گرایش احساس در نظرات[12]” کاربران در حوزه‌های مختلف از قبیل تجارت، سیاست، تعامل بین انسان و کامپیوتر (برای تعیین نوع عکس‌العمل ماشین بر اساس نظر انسان)، و در انواع تصمیم‌گیری‌های افراد حقیقی و حقوقی کاربرد فراوانی دارد که در آغاز بحث برخی از آن‌ ها مورد اشاره قرار گرفتند. این موضوع به‌همراه حجم پایین کار انجام‌شده‌ی مرتبط در حوزه‌ی زبان فارسی (در جستجوی انجام‌شده هیچ مقاله‌ی منتشر‌شده‌ای در این حوزه برای زبان فارسی یافت نشد)، انجام مطالعه در این رابطه برای نظرات بیان‌شده به زبان فارسی را ضروری می کند.

 

علاوه‌بر نیاز به تحقیقات در حوزه‌ی مذکور، اکنون پس از حدود یک دهه که از شروع مطالعات در زمینه‌ی کاوش در نظرات می‌گذرد و ابعاد گوناگونی از آن روشن شده و تا حدودی برروی آن‌ ها تحقیق شده است، جای خالی سیستمی که از محصولات خروجی از تحقیقات این حوزه‌های تحقیقاتی، به صورت مجتمع و ترکیبی بهره ببرد و با تجمیع و هماهنگی بین آن‌ ها همراه با بهره گرفتن از محصولات تحقیقات زمینه‌های مرتبط دیگر، به ارائه‌ سرویس‌های کاربردی و ترکیبی‌ای بپردازد که به‌تنهایی توسط هیچ‌یک از این بخش‌ها و بدون همکاری با بخش‌های دیگر امکان‌پذیر نخواهد بود دیده می‌شود. چنین سیستمی که کاربران بتوانند انواع گوناگون از نیاز‌های خود را به‌خوبی به آن منتقل کنند و آن‌ ها را در مدت زمان کوتاهی دریافت کنند قطعا مورد استقبال شدید کاربران مختلف قرار خواهد گرفت. به عنوان مثال ممکن است تولید کنندگان یک کالای تخصصی با کاربرد صنعتی، نیاز به آگاهی از گرایش نظرات افرادی که دارای تخصص در آن صنعت

پایان نامه

 هستند در رابطه با آن کالای خاص و به صورت خلاصه‌شده داشته باشند. در چنین حالتی سیستم با بهره گرفتن از محصول بدست‌آمده از تحقیقات انجام‌شده برای تشخیص هویت اظهارنظرکنندگان و استخراج خصوصیات آن‌ ها، نظراتی که توسط افراد مورد‌نظر بیان شده‌اند را شناسایی می‌کند؛ سپس از میان آن‌ ها با بهره گرفتن از محصول تحقیقات انجام‌شده برای تشخیص هدف اظهارنظر، نظراتی که در رابطه با کالای مورد نظر بیان شده‌اند را جدا می‌کند؛ بعد از آن مثبت یا منفی بودن گرایش این نظرات را با بهره گرفتن از محصول بدست‌آمده از تحقیقات مربوط به “تشخیص گرایش احساس” تعیین می‌کند؛ و نهایتاً با بهره گرفتن از محصول بدست‌آمده از تحقیقات انجام‌شده در رابطه با خلاصه‌سازی نتایج حاصل را خلاصه‌سازی کرده و به کاربر نمایش می‌دهد. مثال‌های دیگری از نیازهایی متنوعی که کاربران مختلف می‌توانند با در اختیار داشتن چنین سیستمی به آن‌ ها دستیابی پیدا کنند عبارتند از : یافتن اشخاصی که در رابطه با یک هدف خاص دارای نظر مثبت هستند، یافتن نظرات منفی که در رابطه با هدفی خاص و در یک بازه‌ی زمانی خاص بیان شده‌اند، و یافتن گرایش کاربرانی که در یک منطقه‌ی خاص سکونت دارند و در محدوده‌ی سنی خاصی هستند نسبت به یک موضوع اجتماعی.

 

1-2. اهداف تحقیق

 

بر اساس ضرورتی که برای کار در حوزه‌ی تشخیص گرایش احساس در نظرات کاربران بویژه در زبان فارسی ذکر شد در فصل چهار از این پروژه به این موضوع می‌پردازیم و سعی در رده‌بندی[13] گرایش نظرات کاربران در غالب دو رده‌ی مثبت و منفی خواهیم داشت.

 

بنابر [2] این مسئله می‌تواند در قالب یک مسئله‌ی “یادگیری تحت نظارت[14]” بیان شود که دارای رده‌های مثبت، منفی، و خنثی است و داده‌های استفاده‌شده (برای آموزش[15] و آزمایش[16]) در تحقیقات موجود در این رابطه، اغلب نظراتی است که کاربران در مورد کالاها اظهار کرده‌اند. مزیت استفاده از این داده‌ها آماده بودن آن‌ ها به دلیل مشخص بودن مثبت، منفی، یا خنثی بودن آن‌ ها ذکر شده است.

 

برای فراهم کردن داده‌های مورد بررسی در این پایان‌نامه، پس از بررسی زمینه‌های گوناگون نظیر نظرات کاربران در شبکه‌های اجتماعی، و نظرات کاربران در مورد گوشی‌های موبایل، نهایتا نظرات کاربران در یکی از پربازدید‌ترین پایگاه‌های خبری یعنی پایگاه خبری تابناک انتخاب گردید. به‌روز بودن و متنوع بودن اخبار درج‌شده در این پایگاه بستر مناسبی برای ارزیابی نظرات مردم در رابطه با موضوعات گوناگون از قبیل سیاسی، اجتماعی، و اقتصادی را فراهم می‌کند.

 

به‌طور خلاصه هدف از کار انجام‌شده در فصل چهار از این پایان‌نامه تشخیص مثبت یا منفی بودن گرایش احساس موجود در نظرات کاربران سایت خبری پربازدید تابناک با بهره گرفتن از برخی رده‌بندهای شناخته‌شده و مشخصه‌ های جدید ارائه‌شده است. در این راستا تلاش می‌شود تا قابلیت رده‌بند‌های مورد استفاده و حالات و ترکیب‌های گوناگون مشخصه‌ های معرفی‌شده مورد بررسی قرار گیرند.

 

در راستای نیاز به استفاده‌ی مجتمع از دستاورد‌های تحقیقات مختلف زیر‌مجموعه‌ی حوزه‌ی کاوش در نظرات و تحقیقات حوزه‌های دیگر و ارائه‌ خدمات ترکیبی مورد درخواست کاربران که در بخش 1-2 مطرح شد، هدف از فصل سه ارائه‌ ایده‌ی جدیدی در حوزه‌ی کاوش در نظرات است که به رفع این نیاز کمک کند. در این فصل تلاش خواهد شد تا با در کنار هم قرار دادن محصولات تحقیقات انجام‌شده در حوزه‌ی کاوش در نظرات و برخی حوزه‌های مرتبط پردازش متن، هماهنگی میان آن‌ ها، الهام گرفتن از معماری موتور‌های جستجوی دیگر، و ارائه‌ نوآوری، ایده و معماری پیشنهادی برای سیستمی تحت عنوان “موتور جستجوی نظرات” ارائه شود.

 

[1] Weblog

 

[2] Social Network

 

[3] Data Mining

 

[4] Opinion Mining

 

[5] Text Mining

 

[6] Tokenization

 

[7] Pos Tagging

 

[8] Sentiment Classification

 

[9] Sentiment Analysis

 

[10] Sentiment Polarity Identidfication

 

[11] Sentiment Orientation Identification

 

[12] Sentiment Orientation of Reviews

 

[13] Classification

 

[14] Supervised Learning

 

[15] Train

 

[16] Test

 

ممکن است هنگام انتقال از فایل اصلی به داخل سایت بعضی متون به هم بریزد یا بعضی نمادها و اشکال درج نشود ولی در فایل دانلودی همه چیز مرتب و کامل و با فرمت ورد موجود است

 

متن کامل را می توانید دانلود نمائید

 

چون فقط تکه هایی از متن پایان نامه در این صفحه درج شده (به طور نمونه)

 

ولی در فایل دانلودی متن کامل پایان نامه

 

 با فرمت ورد word که قابل ویرایش و کپی کردن می باشند

 

موجود است


فرم در حال بارگذاری ...

« پایان نامه ارشد مهندسی فناوری اطلاعات: تجارت الکترونیک در صنعت بیمهپایان نامه روانشناسی تربیتی: بررسی نوع دوستی در روابط اجتماعی و عوامل موثر بر آن مورد مطالعه دانش آموزان مقطع متوسطه منطقه 2تهران »