چیستی، چالش‌ها و چشم‌اندازهای علوم اجتماعی محاسباتی بررسی شد

پنجاه و سومین نشست مؤسسه مطالعات فرهنگی و اجتماعی و پنجمین نشست تخصصی گروه مطالعات ارتباطات و فضای مجازی مؤسسه با موضوع “علوم اجتماعی محاسباتی” برگزار ‌شد.

به گزارش خبرگزاری شبستان، دکتر «حسین کرمانی»، همکار پژوهشی  مؤسسه مطالعات فرهنگی و اجتماعی در این نشست در توضیح علوم اجتماعی محاسباتی گفت: این حوزه علمی بسیار جدید از سال ۲۰۰۹ که مقاله‌ای در این خصوص در مجله ساینس منتشر شد مورد توجه قرار گرفت و طی سال‌های اخیر گروه‌های پژوهشی، موسسات تحقیقاتی و دانشکده‌هایی در برخی دانشگاه‌های بزرگ دنیا در این حوزه ایجاد شده است با این حال علوم اجتماعی محاسباتی هنوز در کشور ما چندان شناخته شده نیست و اهمیتی که باید به آن داده شود داده نشده است.

وی خاطرنشان کرد: مانع جدی در توسعه این حوزه در کشور، عدم شناخت مناسب آن چه در بین استادان و چه مدیران و آشنایی و اطلاعات گنگی است که درباره آن وجود دارد. به طوری که هر کس چیزی درباره آن شنیده ولی مفاهیم و خط و مرزها و تفاوت‌ها و ارتباط آن با حوزه‌های دیگر مثل کلان داده‌ها و دیتاماینینگ و علوم شناختی و … را نمی‌دانند و دانشگاه‌های کشور هم که اساسا به این حوزه ورود نکرده‌اند.

این مسئله قطعا به دانشجویان ما لطمه زیادی می‌زند چون از بحث‌های روز دنیا عقب می‌مانند و به دلیل عدم آشنایی با تکنیک‌ها و ابزارهای این حوزه نمی‌توانند در چاپ مقاله یا اجرای پروژه‌های خارجی مشارکت داشته باشند.

کرمانی با بیان اینکه علوم اجتماعی محاسباتی ریشه در انقلاب کلان داده‌ها (بیگ دیتا) دارد در تعریف کلان داده‌ها گفت: وقتی وارد اینترنت می‌شویم ردپاهای دیجیتالی (داده‌های دیجیتالی) از ما به جای می ماند که در پی  استفاده ما از سیستم‌های رایانه‌ای است. باقی ماندن بخشی از این داده‌ها آگاهانه است مثل توییت‌هایی که می‌نویسیم ولی بخش بزرگ‌تری از این ردپاها خارج از خواست ما ایجاد می‌شوند مثلا وقتی به گوگل وصل می‌شویم، موقعیت مکانی و اطلاعات دیگری را درباره خود در اختیار گوگل می‌گذاریم. وقتی این ردپاهای دیجیتالی در مقیاس بالا جمع می‌شوند کلان داده‌هایی فراهم می‌شوند که می‌توان تحقیقات خیلی مهیجی براساس آنها انجام داد.

وی افزود: در علوم کامپیوتر با توجه به بحث ذخیره‌سازی این کلان داده‌ها در دیتا بیس‌ها، حجم این کلان داده‌ها بسیار مهم است. بر همین اساس، کلان‌داده‌ها با مبنایی کمی، مجموعه‌هایی از داده تعریف می‌شوند که اندازه آنها فراتر از پایگاه داده‌های معمولی است. تعریف دیگری وجود دارد مبنی بر این که کلان‌داده یعنی داده‌هایی که نمی‌توانند در یک ابزار ذخیره شوند یعنی آن را به صورت یک مفهوم نسبی تعریف می‌کنند. چون مثلا در دهه‌های قبل ابزارهای موجود نهایت تا ۶ مگابایت  داده را ذخیره می‌کردند و بزرگتر از آن کلان‌داده بود ولی الان ۱۰ گیگابایت را هم نمی‌توانیم کلان‌داده بنامیم.

این دانش آموخته دکتری ارتباطات در ادامه با بیان این که تعریف علوم اجتماعی از کلان‌داده‌ها، مبنایی کیفی و فراتر از کمیت داده‌ها دارد، اظهار داشت: محققان علوم اجتماعی برخلاف علوم کامپیوتر علاوه بر کلان‌داده‌ها با داده‌های کوچکتر هم سروکار دارند و از این قبیل داده‌ها هم در تحقیقات خود استفاده زیادی می‌کنند. البته با توجه به چالش‌هایی که آنها معمولا با نرم افزارهای محاسباتی دارند، مواجهه با حجم عظیم داده‌ها (کلان‌داده‌ها) طبعا دشواری‌ها و مشکلات مضاعفی را به محققان علوم اجتماعی تحمیل کرده است. مثلا پنج میلیون توئیت در نرم افزارهایی مثل اس پی اس اس و اکسل حتی قابل ذخیره‌سازی نیست و باید از نرم افزارهای خاص کلان‌داده‌ها استفاده کنند.

کرمانی تصریح کرد: محققان علوم اجتماعی از اواخر دهه ۱۹۶۰ و اوایل دهه ۷۰ از نرم افزارهای رایانه‌ای در تحقیقات خود استفاده کرده‌اند و با آمدن اینترنت امکانات تازه‌ای مثل پرسشنامه‌ای اینترنتی و … هم در اختیار آنها قرار گرفته و در سال‌های اخیر با ظهور علوم اجتماعی محاسباتی کلان داده‌ها و هم ابزارهای  لازم برای مطالعه بر روی آنها را پیدا کرده‌اند. البته چون اغلب شرکت‌ها اجازه دسترسی محققان به کلان داده‌های جمع‌آوری شده از کاربران خود را نمی‌دهند، محققان علوم اجتماعی بیشتر روی کاربران اینترنت و شبکه‌های اجتماعی مثلا تحلیل محتوای کامنت‌های درج شده ذیل اخبار و …  کار می‌کنند که البته جمع‌آوری و تحلیل این قبیل داده‌ها با روش‌های سنتی میسر نیست.  البته این داده‌های جدید بیش از این که از زاویه بزرگی مورد توجه باشند از لحاظ امکان جست و جو و ارجاع و تحلیل اهمیت دارند.

همکار پژوهشی گروه مطالعات ارتباطات و فضای مجازی موسسه مطالعات فرهنگی و اجتماعی اظهار داشت: کلان‌داده‌ها از این لحاظ به عنوان یک مفهوم تکنولوژیک، تحلیلی (شناسایی الگوها در مجموعه‌های بزرگ‌داده) و اسطوره‌شناسی (این باور اشتباه در عامه که کلان داده، اشکال جدیدی از هوش و دانش را فراهم می‌کند که از داده‌های قبلی بهتر است) قابل بررسی هستند. در مجموع کلان داده‌ها را با سه V تعریف می کنند. Volume   اندازه عظیم داده‌ها،   velocity شتاب ظهور و از بین رفتن داده‌ها – مثلا اطلاعات کلان توییتر که فقط چند روز قابل دسترسی هستند – و variety   تنوع این داده‌ها – مثل تنوع بالای داده‌هایی که می‌توان اعم از متن، تصویر، ایموجی، تعداد فالوئرها، اسم کاربر و …  از توئیتر گرفت و آنها را تحلیل کرد. البته بعدا V  چهارمی هم مطرح شد که لذا veracity  صحت داده‌هاست.

کرمانی با بیان این که مطالعه کلان‌داده‌ها هم وجود امکانات و ابزارهای موجود پیچیدگی‌ها و حساسیت‌های خاص خود را دارد اظهار داشت: معمولا کلان‌داده‌ها مثلا توئیت‌ها به دلیل حجم بسیار بالا به صورت رندوم جمع‌آوری و تحلیل می‌شوند مثلا در تحلیل گفتمانی هشتک واکسن_بخرید که در توئیتر ترند شد باید توجه داشت که گروه‌های سیاسی و … به شدت از توئیت‌های کاشته شده  (سمی) استفاده می‌کنند که باعث عدم قطعیت هم می‌شوند. مثلا از کجا می‌توان مطمئن بود که حجم زیادی از  توئیت‌هایی که با این هشتک منتشر شده‌اند و مبنای تحلیل قرار می‌گیرند، توسط روبات‌ها و ارتش سایبری – کاربران اجیر شده – نوشته نشده‌اند؟

این پژوهشگر علوم ارتباطات که انقلاب کلان‌داده‌ها را برای تولد علوم اجتماعی محاسباتی کافی نمی‌داند خاطرنشان کرد که عامل مهمی که به ظهور این حوزه جدید منجر شد تلاش محققان برای رسیدن به روش‌ها و ابزارهای جدید کار روی کلان داده‌ها بود.

به گفته وی، البته منظور، صرف ابزارها نیست؛ بلکه هر ابزاری، علم خاص خود را به وجود می‌آورد. ابزارهای محاسباتی هم همزمان واقعیت مورد محاسبه را نیز شکل می دهند. براین اساس مسئله اساسی‌تری که در حوزه علوم اجتماعی  در کشور ما مورد غفلت قرار گرفته این است که اساسا، امروز، هستی‌شناسی و معرفت‌شناسی علوم اجتماعی به علوم اجتماعی محاسباتی تغییر کرده است. در واقع، کلان‌داده‌ها، روش‌های جدید برای شناخت و حتی تعریف جدید از زندگی اجتماعی ارائه داده‌اند.

کرمانی خاطرنشان کرد: هر کلان‌داده‌ای الزاما به علوم اجتماعی محاسباتی منجر نمی‌شود بلکه آن جست و جو برای ابزارها و روش‌هاست که این حوزه را شکل می‌دهد. اساسا علوم اجتماعی محاسباتی برخلاف علوم اجتماعی سنتی یک علم بینارشته‌ای است. یعنی ناگزیرید از کارهای علوم داده و کامپیوتر و … هم استفاده کنید و در عین حال نظریه‌هایی را که بهترین درک از داده‌ها را به دست می‌دهند بشناسید.

وی در ادامه درباره تفاوت‌های علوم اجتماعی محاسباتی با علوم اجتماعی سنتی گفت: یکی از تفاوت‌های اساسی علوم اجتماعی محاسباتی، بی نیازی آن از  نمونه‌گیری است چون داده‌های عظیمی از کل جمعیت آماری را به شما می‌دهد و لذا  نیازی به نمونه‌گیری نیست و میانگین و میانه و … هم بی معنا می‌شوند. البته در علوم اجتماعی محاسباتی، توزیع‌ها نمایی هستند مثلا در بررسی توئیت‌ها چون تعداد زیادی از توئیت‌ها ریپلای و ریتوئیت دریافت نمی‌کنند، داده‌ها کجی دارند. تفاوت دیگر این که در علوم اجتماعی سنتی بر ویژگی‌های آزمودنی‌ها تاکید می‌شود ولی در علوم اجتماعی محاسباتی، تاکید روی روابط و جریان اطلاعات است.

کرمانی افزود: تفاوت مهم دیگر این که در تحقیقات علوم اجتماعی سنتی به جای واقعیت با ادراکات پاسخگویان سروکار داریم یعنی وقتی در پرسشنامه از افراد می‌پرسیم که مثلا چه قدر از فیس بوک استفاده می‌کنید، افراد با محاسبه ذهنی به صورت حدودی و نسبی جواب می‌دهند در حالی که در علوم اجتماعی محاسباتی این امکان را داریم که دقیقا میزان استفاده فرد از فیس بوک را با دقت کمتر از ثانیه داشته باشیم. در سایر زمینه‌ها مثل تعداد دقیق توئیت‌ها و ریتوئیت‌ها و … هم چنین دقتی وجود دارد.

کرمانی همچنین در خصوص حوزه‌های تحقیقاتی در علوم اجتماعی محاسباتی هم گفت: از مهمترین زمینه‌های پژوهش در این حوزه، تامل در توسعه ابزارها برای انجام تحقیقات مشترک، کنکاش در زبان و گفتمان به عنوان نشانگر، مطالعه درباره روابط اجتماعی، رسانه‌های اجتماعی خصوصا تغییرات آنها در طول زمان و نهایتا پیشرفت در سیستم‌های پیشنهاددهی عصبی و … و البته تقاطع‌هایی است که بین این حوزه‌ها وجود دارد مثلا ضرورت توجه به چند پلتفرم حین نمونه‌گیری.

وی در ادامه در تبیین فرصت‌های فراهم شده در حوزه علوم اجتماعی محاسباتی به امکان دسترسی سریع به حجم عظیمی از داده‌های محال  که با روش‌های سنتی اساسا قابل دسترسی نیست اشاره کرد و گفت: این داده‌های محال مثلا اطلاعاتی که درباره میزان استفاده و رفتار کاربران در شبکه‌های اجتماعی گردآوری می‌شوند چند ویژگی دارند؛ اولا، اکثر آنها برای انجام تحقیق گردآوری نشده‌اند یعنی برخلاف مطالعات سنتی علوم اجتماعی مثل پیمایش و پرسشنامه که فرد اغلب می‌داند در معرض تحقیق است که باعث سوگیری می‌شود در داده‌های علوم اجتماعی محاسباتی چنین سوگیری‌هایی نیست. برتری دیگر این که حجم عظیمی متادیتا (مثل تعداد فالوئرها، مشخصات کاربر، زمان ساخت اکانت و … ) هم در کنار داده‌های اصلی به دست می‌آید که تحلیل‌های دقیق‌تری را امکان پذیر می‌کند مثلا  تغییرات زمانی و جغرافیایی داده‌ها را هم نشان می‌دهد مثلا فلان هشتک بیشتر از چه شهرهایی بوده است. دیگر این که این داده‌ها با سرعت و دقت بسیار بالاتر قابل تحلیل خواهند بود.

کرمانی مشاهده روندهای ناپیدایی که با روش‌های سنتی قابل کشف نبودند و رسیدن به فهمی مناسب از پیچیدگی‌های موجود را از دیگر فرصت‌های ایجاد شده در این حوزه عنوان کرد و گفت: در  سال ۲۰۱۵ محققان از داده‌های تلفن همراه برای محاسبه نرخ بیکاری استفاده کردند. به اساس این طرح تفاوت الگوی جا به جایی فرد شاغل با غیرشاغل بود چون فرد شاغل در یک بازه زمانی مشخص از مکانی مشخص به مکانی مشخص می‌رود و بر همین مبنا محققان به مدل خاصی رسیدند که براساس آن نرخ بیکاری در یک شهر را پیش بینی کردند. از طرف دیگر نظریه‌هایی مثل جریان دو مرحله‌ای ارتباطات یا نظریه برجسته‌سازی و … که با روش‌های سنتی قابل بررسی نبود الان به سهولت قابل بررسی شده است.

وی اضافه کرد: فرصت ایجاد شده دیگر، پارادایم جدید روش‌شناسی است. علوم اجتماعی محاسباتی فقط روش نیست بلکه تلفیقی از روش‌ها و ابزراها و … است. در واقع تلفیقی از روش‌ها پارادایم جدیدی از روش‌شناسی را در علوم اجتماعی محاسباتی رغم زده است.

کرمانی در عین حال به چالش‌های معرفت‌شناسی و هنجاری که در علوم اجتماعی محاسباتی با آنها مواجه اشاره کرد و گفت: چالش‌های معرفت‌شناسی مثل شکاف محاسباتی که در عرصه آموزش به وجود آمده است. در بسیاری از دانشگاه‌های بزرگ دنیا هنوز این رشته به طور جدی مطرح نیست لذا در علوم اجتماعی شکاف بزرگی بین کسانی که این مهارت‌ها را دارند با کسانی که ندارند ایجاد شده است. کمبود متخصصان کار در این حوزه بین‌رشته‌ای و تسلط نگاه فنی با روی کارآمدن متخصصان فنی که درک محققان علوم اجتماعی از روش‌ها و ابعاد نظری ندارند از دیگر مشکلات بروز کرده در این حوزه است.

وی در تشریح چالش اخیر گفت: داده‌ها خودشان برای خودشان معنایی ندارند و رویکردهای روش‌شناسی محقق بسیار مهم است. متاسفانه بسیاری از تحقیقات علوم اجتماعی محاسباتی در ایران به شکل فاجعه باری از چنین مشکلاتی رنج می‌برند. مثلا در زمینه کدگذاری محتوا در علوم اجتماعی خیلی چالش داریم که در تحقیقات علوم اجتماعی محاسباتی کشور به آنها توجه نمی‌شود و از خشت اول علوم اجتماعی محاسباتی در کشور کج بالا می‌رود.

از دیگر چالش‌های این حوزه، مشکل نگهداری خود کلان‌داده‌ها و هزینه‌های آن و شکاف اطلاعاتی ناشی از عدم دسترسی است. مضافا این که عدم امکان دسترسی مجدد به داده‌های استفاده شده توسط محقق، داوری مقالات را هم با مشکل جدی مواجه می‌کند.

سوگیری سیستماتیک اطلاعات اخذ شده – با توجه  به این که نمی‌دانیم توییتر و شبکه‌های اجتماعی دیگر حجم کامل نمونه‌ها را به ما داده‌اند یا اگر انتخاب کرده‌اند این نمونه‌ها را چه طور  تهیه کرده‌اند – و نامشخص بودن چگونگی این سوگیری و این که حتی اگر کل داده‌های یک پلتفرم را هم داشته باشید به دلیل عدم عضویت همه مردم در آن پلتفرم یا این که  برخی چند اکانت دارند یا برخی فقط خواننده مطالب دیگران هستند و بازخوردی نمی‌دهند از دیگر چالش‌های علوم اجتماعی محاسباتی است.

کرمانی با تاکید بر ضرورت توجه به وجود داده‌های سمی در تحقیقات علوم اجتماعی محاسباتی تصریح کرد: در این حوزه اغلب تنها امکان کار روی داده‌های در دسترس را داریم نه کل داده‌ها که همین باعث سوگیری می‌شود مثلا در مواردی مثل بررسی شیوه‌های تبعیض جنسیتی گوگل و توئیتر احتمالا این شرکت‌ها داده‌های لازم را به شما نمی‌دهند. از طرف دیگر داده‌های مورد بررسی مثل داده‌های مکانی تلفن همراه می‌توانند در بسیاری موارد گمراه کننده باشند.

مشکل دیگر  اینکه در علوم اجتماعی محاسباتی داده‌ها، نظم و ترتیب و ساختارمندی داده‌های روش‌های سنتی را ندارند و پاکسازی و آماده‌سازی زیادی لازم دارند که می‌تواند به سوگیری‌هایی منجر شود.

وی با رد این دیدگاه اسطوره‌ای که کلان داده‌ها فی‌نفسه موثرتر از روش‌های سنتی هستند اظهار داشت: روش‌های محاسباتی همیشه بر روش‌های سنتی برتری ندارند و باید تلاش کرد قبل از ورود به این حوزه تا حد امکان روی نظریه‌های علوم اجتماعی سنتی مسلط شد. متاسفانه چون کار روی  کلان داده‌ها مد شده و شیک و باکلاس به نظر می‌رسد برخی محققان به این حوزه جلب شده‌اند در حالی که در صورت بی توجهی به مبانی نظری راه به جایی نمی‌برند.

محقق ابتدا باید روی نظریه‌ها مسلط باشد و بعد ببیند مسئله چیست و برای آن مسئله چه روش‌ها و داده‌هایی مناسب‌تر است.

کرمانی در پایان با اشاره به چالش‌های هنجاری علوم اجتماعی محاسباتی از قبیل چالش‌های اخلاقی و قانونی کار روی کلان‌داده‌ها گفت: گمنامی، رضایت آگاهانه کاربران و نیکخویی سه اصل اساسی در استفاده از کلان‌داده‌هاست. این در حالی است که کسب رضایت میلیون‌ها نفر در کار روی کلان‌داده‌ها اساسا ممکن نیست. از طرف دیگر درست است که افراد مثلا آنلاین توئیت می‌زنند ولی ممکن است در شرایط زمانی خاصی راضی نباشند که از اطلاعات آنها استفاده شود. اصل نیک خویی به این معنا است که کار محقق باید به دیگران سود برساند و از ضرر زدن به آنها خودداری کند در حالی که در کلان داده‌ها امکان لو رفتن اطلاعات شخصی افراد وجود دارد و لذا مطالعات علوم اجتماعی محاسباتی  ممکن است کاربران را به خطر بیندازد. مشکل بعدی استفاده دوگانه از این داده‌هاست حکومت‌ها می‌توانند برای سرکوب و آزار افراد از آنها استفاده کنند. چالش دیگر از لحاظ عادلانه بودن دسترسی به اطلاعات با توجه به فروش اطلاعات از سوی شرکت‌هاست. خلاء‌های قانونی زیادی هم در زمینه در اختیار قرار دادن اطلاعات پلتفرم‌ها وجود  دارد به طوری که گفته می‌شود این پلتفرم‌ها هستند که تا حد زیادی به مطالعات علوم اجتماعی محاسباتی جهت دهی می‌کنند.

 

کد خبر 1049040

برچسب‌ها

نظر شما

شما در حال پاسخ به نظر «» هستید.
captcha