در پنجمین نشست تخصصی گروه ارتباطات و فضای مجازی مؤسسه بررسی شد
چیستی، چالشها و چشماندازهای علوم اجتماعی محاسباتی
پنجاه و سومین نشست مؤسسه مطالعات فرهنگی و اجتماعی و پنجمین نشست تخصصی گروه مطالعات ارتباطات و فضای مجازی مؤسسه با موضوع «علوم اجتماعی محاسباتی» برگزار شد.
وی خاطرنشان کرد: مانع جدی در توسعه این حوزه در کشور، عدم شناخت مناسب آن چه در بین استادان و چه مدیران و آشنایی و اطلاعات گنگی است که درباره آن وجود دارد. به طوری که هر کس چیزی درباره آن شنیده ولی مفاهیم و خط و مرزها و تفاوتها و ارتباط آن با حوزههای دیگر مثل کلان دادهها و دیتاماینینگ و علوم شناختی و … را نمیدانند و دانشگاههای کشور هم که اساسا به این حوزه ورود نکردهاند.
این مسئله قطعا به دانشجویان ما لطمه زیادی میزند چون از بحثهای روز دنیا عقب میمانند و به دلیل عدم آشنایی با تکنیکها و ابزارهای این حوزه نمیتوانند در چاپ مقاله یا اجرای پروژههای خارجی مشارکت داشته باشند.
کرمانی با بیان اینکه علوم اجتماعی محاسباتی ریشه در انقلاب کلان دادهها (بیگ دیتا) دارد در تعریف کلان دادهها گفت: وقتی وارد اینترنت میشویم ردپاهای دیجیتالی (دادههای دیجیتالی) از ما به جای می ماند که در پی استفاده ما از سیستمهای رایانهای است. باقی ماندن بخشی از این دادهها آگاهانه است مثل توییتهایی که مینویسیم ولی بخش بزرگتری از این ردپاها خارج از خواست ما ایجاد میشوند مثلا وقتی به گوگل وصل میشویم، موقعیت مکانی و اطلاعات دیگری را درباره خود در اختیار گوگل میگذاریم. وقتی این ردپاهای دیجیتالی در مقیاس بالا جمع میشوند کلان دادههایی فراهم میشوند که میتوان تحقیقات خیلی مهیجی براساس آنها انجام داد.
وی افزود: در علوم کامپیوتر با توجه به بحث ذخیرهسازی این کلان دادهها در دیتا بیسها، حجم این کلان دادهها بسیار مهم است. بر همین اساس، کلاندادهها با مبنایی کمی، مجموعههایی از داده تعریف میشوند که اندازه آنها فراتر از پایگاه دادههای معمولی است. تعریف دیگری وجود دارد مبنی بر این که کلانداده یعنی دادههایی که نمیتوانند در یک ابزار ذخیره شوند یعنی آن را به صورت یک مفهوم نسبی تعریف میکنند. چون مثلا در دهههای قبل ابزارهای موجود نهایت تا ۶ مگابایت داده را ذخیره میکردند و بزرگتر از آن کلانداده بود ولی الان ۱۰ گیگابایت را هم نمیتوانیم کلانداده بنامیم.
این دانش آموخته دکتری ارتباطات در ادامه با بیان این که تعریف علوم اجتماعی از کلاندادهها، مبنایی کیفی و فراتر از کمیت دادهها دارد، اظهار داشت: محققان علوم اجتماعی برخلاف علوم کامپیوتر علاوه بر کلاندادهها با دادههای کوچکتر هم سروکار دارند و از این قبیل دادهها هم در تحقیقات خود استفاده زیادی میکنند. البته با توجه به چالشهایی که آنها معمولا با نرم افزارهای محاسباتی دارند، مواجهه با حجم عظیم دادهها (کلاندادهها) طبعا دشواریها و مشکلات مضاعفی را به محققان علوم اجتماعی تحمیل کرده است. مثلا پنج میلیون توئیت در نرم افزارهایی مثل اس پی اس اس و اکسل حتی قابل ذخیرهسازی نیست و باید از نرم افزارهای خاص کلاندادهها استفاده کنند.
کرمانی تصریح کرد: محققان علوم اجتماعی از اواخر دهه ۱۹۶۰ و اوایل دهه ۷۰ از نرم افزارهای رایانهای در تحقیقات خود استفاده کردهاند و با آمدن اینترنت امکانات تازهای مثل پرسشنامهای اینترنتی و … هم در اختیار آنها قرار گرفته و در سالهای اخیر با ظهور علوم اجتماعی محاسباتی کلان دادهها و هم ابزارهای لازم برای مطالعه بر روی آنها را پیدا کردهاند. البته چون اغلب شرکتها اجازه دسترسی محققان به کلان دادههای جمعآوری شده از کاربران خود را نمیدهند، محققان علوم اجتماعی بیشتر روی کاربران اینترنت و شبکههای اجتماعی مثلا تحلیل محتوای کامنتهای درج شده ذیل اخبار و … کار میکنند که البته جمعآوری و تحلیل این قبیل دادهها با روشهای سنتی میسر نیست. البته این دادههای جدید بیش از این که از زاویه بزرگی مورد توجه باشند از لحاظ امکان جست و جو و ارجاع و تحلیل اهمیت دارند.
همکار پژوهشی گروه مطالعات ارتباطات و فضای مجازی موسسه مطالعات فرهنگی و اجتماعی اظهار داشت: کلاندادهها از این لحاظ به عنوان یک مفهوم تکنولوژیک، تحلیلی (شناسایی الگوها در مجموعههای بزرگداده) و اسطورهشناسی (این باور اشتباه در عامه که کلان داده، اشکال جدیدی از هوش و دانش را فراهم میکند که از دادههای قبلی بهتر است) قابل بررسی هستند. در مجموع کلان دادهها را با سه V تعریف می کنند. Volume اندازه عظیم دادهها، velocity شتاب ظهور و از بین رفتن دادهها – مثلا اطلاعات کلان توییتر که فقط چند روز قابل دسترسی هستند – و variety تنوع این دادهها – مثل تنوع بالای دادههایی که میتوان اعم از متن، تصویر، ایموجی، تعداد فالوئرها، اسم کاربر و… از توئیتر گرفت و آنها را تحلیل کرد. البته بعدا V چهارمی هم مطرح شد که لذا veracity صحت دادههاست.
کرمانی با بیان این که مطالعه کلاندادهها هم وجود امکانات و ابزارهای موجود پیچیدگیها و حساسیتهای خاص خود را دارد اظهار داشت: معمولا کلاندادهها مثلا توئیتها به دلیل حجم بسیار بالا به صورت رندوم جمعآوری و تحلیل میشوند مثلا در تحلیل گفتمانی هشتک واکسن_بخرید که در توئیتر ترند شد باید توجه داشت که گروههای سیاسی و … به شدت از توئیتهای کاشته شده (سمی) استفاده میکنند که باعث عدم قطعیت هم میشوند. مثلا از کجا میتوان مطمئن بود که حجم زیادی از توئیتهایی که با این هشتک منتشر شدهاند و مبنای تحلیل قرار میگیرند، توسط روباتها و ارتش سایبری – کاربران اجیر شده – نوشته نشدهاند؟
این پژوهشگر علوم ارتباطات که انقلاب کلاندادهها را برای تولد علوم اجتماعی محاسباتی کافی نمیداند خاطرنشان کرد که عامل مهمی که به ظهور این حوزه جدید منجر شد تلاش محققان برای رسیدن به روشها و ابزارهای جدید کار روی کلان دادهها بود.
به گفته وی، البته منظور، صرف ابزارها نیست؛ بلکه هر ابزاری، علم خاص خود را به وجود میآورد. ابزارهای محاسباتی هم همزمان واقعیت مورد محاسبه را نیز شکل می دهند. براین اساس مسئله اساسیتری که در حوزه علوم اجتماعی در کشور ما مورد غفلت قرار گرفته این است که اساسا، امروز، هستیشناسی و معرفتشناسی علوم اجتماعی به علوم اجتماعی محاسباتی تغییر کرده است. در واقع، کلاندادهها، روشهای جدید برای شناخت و حتی تعریف جدید از زندگی اجتماعی ارائه دادهاند.
کرمانی خاطرنشان کرد: هر کلاندادهای الزاما به علوم اجتماعی محاسباتی منجر نمیشود بلکه آن جست و جو برای ابزارها و روشهاست که این حوزه را شکل میدهد. اساسا علوم اجتماعی محاسباتی برخلاف علوم اجتماعی سنتی یک علم بینارشتهای است. یعنی ناگزیرید از کارهای علوم داده و کامپیوتر و … هم استفاده کنید و در عین حال نظریههایی را که بهترین درک از دادهها را به دست میدهند بشناسید.
وی در ادامه درباره تفاوتهای علوم اجتماعی محاسباتی با علوم اجتماعی سنتی گفت: یکی از تفاوتهای اساسی علوم اجتماعی محاسباتی، بی نیازی آن از نمونهگیری است چون دادههای عظیمی از کل جمعیت آماری را به شما میدهد و لذا نیازی به نمونهگیری نیست و میانگین و میانه و … هم بی معنا میشوند. البته در علوم اجتماعی محاسباتی، توزیعها نمایی هستند مثلا در بررسی توئیتها چون تعداد زیادی از توئیتها ریپلای و ریتوئیت دریافت نمیکنند، دادهها کجی دارند. تفاوت دیگر این که در علوم اجتماعی سنتی بر ویژگیهای آزمودنیها تاکید میشود ولی در علوم اجتماعی محاسباتی، تاکید روی روابط و جریان اطلاعات است.
کرمانی افزود: تفاوت مهم دیگر این که در تحقیقات علوم اجتماعی سنتی به جای واقعیت با ادراکات پاسخگویان سروکار داریم یعنی وقتی در پرسشنامه از افراد میپرسیم که مثلا چه قدر از فیس بوک استفاده میکنید، افراد با محاسبه ذهنی به صورت حدودی و نسبی جواب میدهند در حالی که در علوم اجتماعی محاسباتی این امکان را داریم که دقیقا میزان استفاده فرد از فیس بوک را با دقت کمتر از ثانیه داشته باشیم. در سایر زمینهها مثل تعداد دقیق توئیتها و ریتوئیتها و … هم چنین دقتی وجود دارد.
کرمانی همچنین در خصوص حوزههای تحقیقاتی در علوم اجتماعی محاسباتی هم گفت: از مهمترین زمینههای پژوهش در این حوزه، تامل در توسعه ابزارها برای انجام تحقیقات مشترک، کنکاش در زبان و گفتمان به عنوان نشانگر، مطالعه درباره روابط اجتماعی، رسانههای اجتماعی خصوصا تغییرات آنها در طول زمان و نهایتا پیشرفت در سیستمهای پیشنهاددهی عصبی و … و البته تقاطعهایی است که بین این حوزهها وجود دارد مثلا ضرورت توجه به چند پلتفرم حین نمونهگیری.
وی در ادامه در تبیین فرصتهای فراهم شده در حوزه علوم اجتماعی محاسباتی به امکان دسترسی سریع به حجم عظیمی از دادههای محال که با روشهای سنتی اساسا قابل دسترسی نیست اشاره کرد و گفت: این دادههای محال مثلا اطلاعاتی که درباره میزان استفاده و رفتار کاربران در شبکههای اجتماعی گردآوری میشوند چند ویژگی دارند؛ اولا، اکثر آنها برای انجام تحقیق گردآوری نشدهاند یعنی برخلاف مطالعات سنتی علوم اجتماعی مثل پیمایش و پرسشنامه که فرد اغلب میداند در معرض تحقیق است که باعث سوگیری میشود در دادههای علوم اجتماعی محاسباتی چنین سوگیریهایی نیست. برتری دیگر این که حجم عظیمی متادیتا (مثل تعداد فالوئرها، مشخصات کاربر، زمان ساخت اکانت و … ) هم در کنار دادههای اصلی به دست میآید که تحلیلهای دقیقتری را امکان پذیر میکند مثلا تغییرات زمانی و جغرافیایی دادهها را هم نشان میدهد مثلا فلان هشتک بیشتر از چه شهرهایی بوده است. دیگر این که این دادهها با سرعت و دقت بسیار بالاتر قابل تحلیل خواهند بود.
کرمانی مشاهده روندهای ناپیدایی که با روشهای سنتی قابل کشف نبودند و رسیدن به فهمی مناسب از پیچیدگیهای موجود را از دیگر فرصتهای ایجاد شده در این حوزه عنوان کرد و گفت: در سال ۲۰۱۵ محققان از دادههای تلفن همراه برای محاسبه نرخ بیکاری استفاده کردند. به اساس این طرح تفاوت الگوی جا به جایی فرد شاغل با غیرشاغل بود چون فرد شاغل در یک بازه زمانی مشخص از مکانی مشخص به مکانی مشخص میرود و بر همین مبنا محققان به مدل خاصی رسیدند که براساس آن نرخ بیکاری در یک شهر را پیش بینی کردند. از طرف دیگر نظریههایی مثل جریان دو مرحلهای ارتباطات یا نظریه برجستهسازی و … که با روشهای سنتی قابل بررسی نبود الان به سهولت قابل بررسی شده است.
وی اضافه کرد: فرصت ایجاد شده دیگر، پارادایم جدید روششناسی است. علوم اجتماعی محاسباتی فقط روش نیست بلکه تلفیقی از روشها و ابزراها و … است. در واقع تلفیقی از روشها پارادایم جدیدی از روششناسی را در علوم اجتماعی محاسباتی رغم زده است.
کرمانی در عین حال به چالشهای معرفتشناسی و هنجاری که در علوم اجتماعی محاسباتی با آنها مواجه اشاره کرد و گفت:
چالشهای معرفتشناسی مثل شکاف محاسباتی که در عرصه آموزش به وجود آمده است. در بسیاری از دانشگاههای بزرگ دنیا هنوز این رشته به طور جدی مطرح نیست لذا در علوم اجتماعی شکاف بزرگی بین کسانی که این مهارتها را دارند با کسانی که ندارند ایجاد شده است. کمبود متخصصان کار در این حوزه بینرشتهای و تسلط نگاه فنی با روی کارآمدن متخصصان فنی که درک محققان علوم اجتماعی از روشها و ابعاد نظری ندارند از دیگر مشکلات بروز کرده در این حوزه است.
وی در تشریح چالش اخیر گفت: دادهها خودشان برای خودشان معنایی ندارند و رویکردهای روششناسی محقق بسیار مهم است. متاسفانه بسیاری از تحقیقات علوم اجتماعی محاسباتی در ایران به شکل فاجعه باری از چنین مشکلاتی رنج میبرند. مثلا در زمینه کدگذاری محتوا در علوم اجتماعی خیلی چالش داریم که در تحقیقات علوم اجتماعی محاسباتی کشور به آنها توجه نمیشود و از خشت اول علوم اجتماعی محاسباتی در کشور کج بالا میرود.
از دیگر چالشهای این حوزه، مشکل نگهداری خود کلاندادهها و هزینههای آن و شکاف اطلاعاتی ناشی از عدم دسترسی است. مضافا این که عدم امکان دسترسی مجدد به دادههای استفاده شده توسط محقق، داوری مقالات را هم با مشکل جدی مواجه میکند.
سوگیری سیستماتیک اطلاعات اخذ شده – با توجه به این که نمیدانیم توییتر و شبکههای اجتماعی دیگر حجم کامل نمونهها را به ما دادهاند یا اگر انتخاب کردهاند این نمونهها را چه طور تهیه کردهاند – و نامشخص بودن چگونگی این سوگیری و این که حتی اگر کل دادههای یک پلتفرم را هم داشته باشید به دلیل عدم عضویت همه مردم در آن پلتفرم یا این که برخی چند اکانت دارند یا برخی فقط خواننده مطالب دیگران هستند و بازخوردی نمیدهند از دیگر چالشهای علوم اجتماعی محاسباتی است.
کرمانی با تاکید بر ضرورت توجه به وجود دادههای سمی در تحقیقات علوم اجتماعی محاسباتی تصریح کرد: در این حوزه اغلب تنها امکان کار روی دادههای در دسترس را داریم نه کل دادهها که همین باعث سوگیری میشود مثلا در مواردی مثل بررسی شیوههای تبعیض جنسیتی گوگل و توئیتر احتمالا این شرکتها دادههای لازم را به شما نمیدهند. از طرف دیگر دادههای مورد بررسی مثل دادههای مکانی تلفن همراه میتوانند در بسیاری موارد گمراه کننده باشند.
مشکل دیگر اینکه در علوم اجتماعی محاسباتی دادهها، نظم و ترتیب و ساختارمندی دادههای روشهای سنتی را ندارند و پاکسازی و آمادهسازی زیادی لازم دارند که میتواند به سوگیریهایی منجر شود.
وی با رد این دیدگاه اسطورهای که کلان دادهها فینفسه موثرتر از روشهای سنتی هستند اظهار داشت: روشهای محاسباتی همیشه بر روشهای سنتی برتری ندارند و باید تلاش کرد قبل از ورود به این حوزه تا حد امکان روی نظریههای علوم اجتماعی سنتی مسلط شد. متاسفانه چون کار روی کلان دادهها مد شده و شیک و باکلاس به نظر میرسد برخی محققان به این حوزه جلب شدهاند در حالی که در صورت بی توجهی به مبانی نظری راه به جایی نمیبرند.
محقق ابتدا باید روی نظریهها مسلط باشد و بعد ببیند مسئله چیست و برای آن مسئله چه روشها و دادههایی مناسبتر است.
کرمانی در پایان با اشاره به چالشهای هنجاری علوم اجتماعی محاسباتی از قبیل چالشهای اخلاقی و قانونی کار روی کلاندادهها گفت: گمنامی، رضایت آگاهانه کاربران و نیکخویی سه اصل اساسی در استفاده از کلاندادههاست. این در حالی است که کسب رضایت میلیونها نفر در کار روی کلاندادهها اساسا ممکن نیست. از طرف دیگر درست است که افراد مثلا آنلاین توئیت میزنند ولی ممکن است در شرایط زمانی خاصی راضی نباشند که از اطلاعات آنها استفاده شود. اصل نیک خویی به این معنا است که کار محقق باید به دیگران سود برساند و از ضرر زدن به آنها خودداری کند در حالی که در کلان دادهها امکان لو رفتن اطلاعات شخصی افراد وجود دارد و لذا مطالعات علوم اجتماعی محاسباتی ممکن است کاربران را به خطر بیندازد. مشکل بعدی استفاده دوگانه از این دادههاست حکومتها میتوانند برای سرکوب و آزار افراد از آنها استفاده کنند. چالش دیگر از لحاظ عادلانه بودن دسترسی به اطلاعات با توجه به فروش اطلاعات از سوی شرکتهاست. خلاءهای قانونی زیادی هم در زمینه در اختیار قرار دادن اطلاعات پلتفرمها وجود دارد به طوری که گفته میشود این پلتفرمها هستند که تا حد زیادی به مطالعات علوم اجتماعی محاسباتی جهت دهی میکنند.
نظر شما