عوامل اختلال در پیش‌بینی‌های داده‌کاوی انتخاباتی چه بود؟

عوامل اختلال در پیش‌بینی‌های داده‌کاوی انتخاباتی چه بود؟


دریافت
۳۳ MB

مساله نظرسنجی و داده‌کاوی یکی از داغ‌ترین و جذاب‌ترین موضوعاتی بود که در انتخابات ریاست جمهوری ۱۴۰۳ در رسانه‌ها و میان مردم مورد توجه قرار گرفت. برآورد با خطای ۱۰ درصدی مراکز نظرسنجی و تخمین بهتر مراکز داده‌کاوی اما و اگرهای زیادی را در خصوص رویکردها، کاربردها و امکانات و کمبودهای این مراکز پیش آورد و این سوال را بار دیگر مطرح کرد که داده‌کاوی یا نظرسنجی کدامیک می‌توانند نماینده افکارعمومی باشد؟

اداره کل پژوهش‌های خبری آباجان به نقل از ایرنا در ۴ گزارش پژوهشی و در قالب یک میزگرد تحلیلی، عملکرد مراکز نظرسنجی را در تیرماه ۱۴۰۳ بررسی کرد. در ادامه این رویکرد و در گزارش‌های پیش‌رو، رویکرد و عملکرد مراکز داده‌کاوی مورد تحلیل و واکاوی قرار گرفته است.

برای این بررسی این موضوع از مدیران دو شرکت برجسته این حوزه یعنی شرکت لایف‌وب، دیتاک دعوت شد تا در میزگرد آباجان به نقل از ایرنا حضور یابند. در ادامه گفتگوی آباجان به نقل از ایرنا با دکتر حمیدرضا کشاورز مدیرعامل شرکت لایف‌وب، مهندس امیرحسین عسگری مدیرعامل شرکت دیتاک در قالب متن و تصویر ارائه شده است:

تعاریف، کاربردها و جایگاه داده‌کاوی در رسانه و افکارعمومی

این سوالات در مورد فضای مجازی مطرح است؛ آیا این بستر آینه خوبی برای جامعه است یا خیر؟ آیا همه در فضای مجازی هستند؟ آیا دسترسی اینترنت کامل است؟

آباجان به نقل از ایرنا: با توجه به اینکه هنوز هم در جامعه و حتی رسانه‌ها یک سری ابهامات در مورد داده‌کاوی و کاربردهای آن وجود دارد، از نظر شما مهم‌ترین کاربردهای داده‌کاوی در رسانه و تحلیل و پیش‌بینی پدیده‌هایی مانند انتخابات چیست؟

عسگری: در بحث داده‌کاوی در ابتدا باید در نظر بگیریم که داده‌ای که مورد آنالیز و بررسی قرار می‌دهیم چه داده‌ای است؟ پاسخ آن می‌شود همین داده‌ای که الان داریم در حوزه‌ رسانه استفاده می‌کنیم و مرتبط با فضای اجتماعی و فرهنگی و غیره، داده‌ای است که در فضای مجازی وجود دارد.
پس این سوال مطرح می‌شود که آیا اساسا فضای مجازی آینه‌ خوبی از رفتارهای جامعه هست و می‌تواند جامعه را به ما نشان دهد؟ آیا همه در فضای مجازی هستند؟ آیا دسترسی اینترنت کامل است؟ آیا فعالیت کارهای سازمان یافته و کارهایی که در آن پول هزینه می‌شود، تبلیغات می‌شود کارهایی که در آن ممکن است یک‌نفر بیاید در آن با ده‌ها یا حتی صدها اکانت کار بکند، ربات‌ها چه نقشی دارند، اینها همه سوالاتی است که آیا فضای مجازی آینه خوبی برای جامعه است؟

بر اساس تجربه انتخابات گذشته، داده‌کاوی ظرفیت پیش‌بینی نتایج انتخابات را دارد

دو پاسخ اساسی برای این سوال وجود دارد که بدون بیان جزییات به کلیات آن اشاره می‌کنم. پاسخ اول این است: بله داده‌کاوی مبتنی بر فضای مجازی در انتخابات‌ پیشین و این انتخابات نشان داده است که می‌تواند جامعه را پیش‌بینی کند. یعنی وقتی ما یک رفتاری را بر اساس داده پیش‌بینی می‌کنیم یعنی آن داده‌ای که وجود دارد به یک جامعیت خوبی رسیده است، زیرا اگر داده ایراد داشته باشد قاعدتا ما تا پایان کار با ایراد مواجه هستیم.

عوامل اختلال در پیش‌بینی‌های داده‌کاوی انتخاباتی چه بود؟
امیرحسین عسگری مدیرعامل شرکت دیتاک

براساس آمارها، بیشتر مصرف رسانه‌ای دنیا و ایران در شبکه‌های اجتماعی است

مدیرعامل دیتاک مطرح کرد: مهم‌ترین مصرف رسانه‌ای ایران شامل موارد ذیل است:
۱.شبکه‌های اجتماعی
۲. صدا و سیما
۳. ماهواره

اگر این جامعیت وجود نداشته باشد و این تکثر نباشد یا اگر رفتارهای سازمان‌یافته یا بات‌گونه آنقدر قوی باشند و یا قابل شناسایی نباشند به این خروجی‌ها منتج نمی‌شد. دو این‌که براساس آمارهایی که الان وجود دارد بیشتر مصرف رسانه‌ای دنیا و ایران در شبکه‌های اجتماعی است. یعنی مصرف رسانه‌ای خود ایران را هم در نظر بگیریم یک شبکه‌های اجتماعی است دو صدا و سیما و سه ماهواره است.

در نظرسنجی‌های مختلف ترتیب همین است که آمارهایی هم که ما در گزارش سالانه دیتاک منتشر کردیم عدد و رقم‌ها کاملا نشان دهنده این هست که بزرگی اعدادی که دارد در این فضا کار می‌شود و آن توزیعی که دارد آن‌جا اتفاق می‌افتد، رفتار جامعه را نمایندگی می‌کند.

بات‌ها و کارهای سازمان‌یافته در فضای مجازی قابل تشخیص‌ هستند؟

سوال بعدی این است که آیا می‌شود بات‌ها و کارهای سازمان‌یافته را تشخیص داد؟ پاسخ می‌شود این که بله و نه. بستگی به تعریف ما دارد. اگر تعریف ما بات‌هایی است که به شکل گسترده توزیع رفتاری می‌کنند، به طور مثال هشتگ زیاد یا توئیت زیاد می‌زنند؟ بله شناسایی این‌ها کار زیاد پیچیده ‌ای نیست چند متغیر در تشخیص آن اثرگذار می‌شود، اکانتی که آن را منتشر کرده، رفتارهای قبلی که در سیستم ما ثبت شده که قبلا چه کاری کرده چه زمانی ثبت نام کرده، رفتارهای قبلی هم به همین شکل رفتار کرده یانه قبل از آن رفتارهای نرمال‌تری انجام می‌دهد. یک جاهایی هم یک مرزهایی پیدا می‌کند وارد فضاهای پیچیده‌ای می‌شود که به معنای ناظر نمی‌توان این موضوع را تشخیص داد.

آباجان به نقل از ایرنا: آیا عدد و آماری درباره میزان بات‌های قابل تشخیص و غیرقابل تشخیص وجود دارد؟

مدیرعامل دیتاک: ۸۰ درصد بات‌های فضای مجازی قابل تشخیص هستند

عسگری: ببینید آن چیزی که الان اگر بخواهیم زمین بازی که در آن قرار داریم، بگوییم عمدتاً ۸۰ درصد آن از همان زمین بازی انتشار هست.

با این وجود، ۲۰ درصد هم ممکن است کار پیچیده‌تر باشد و این‌ها در واقع ربات‌های هوشمندتر و انسانی‌تر هستند که کار می‌کنند که آن‌جا اصلا بحث خیلی پیچیده و فلسفی می‌شود که آیا این اصلا بات است یا نه؟ این خودش هویتی پیدا کرده در فضای مجازی اصلا رفتار بات‌گونه‌ای نمی‌کند، با یک هویتی دارد تولید محتوا می‌کند و یک شبکه‌ای توانسته پیرامون خودش شکل بدهد که بحث آن بسیار پیچیده است و وارد جزئیاتش نمی‌شویم.

آباجان به نقل از ایرنا: چرا مراکز داده‌کاوی و نظرسنجی نتوانستند نتایج انتخابات را دقیق برآورد کنند؟

کشاورز: در هفته‌های اخیر، گزاره‌ای خیلی مطرح و به نظر پر تکرار بود، با این مضمون که در این انتخابات مراکز نظرسنجی و داده‌کاوی نتوانستند تشخیص دقیقی بدهند. اولین موضوع مطرح، این است که انتظارمان از پیش‌بینی نتایج چیست؟ یعنی قرار است که آن روند، آن موج و یا آن رشد تشخیص داده بشود و یا این‌که دقیقا آن درصد برآورد یا پیش‌بینی شود؟

مدیرعامل لایف عنوان کرد: چند عامل انتخابات ۱۴۰۳ را ویژه کردند: ۱. حادثه ناگهانی سقوط بالگرد رئیس‌جمهوری و نبود آمادگی فکری و سازمانی برای برگزاری انتخابات. ۲. فقدان تحزب‌گرایی در جامعه و تاثیرات آن در میان مردم. ۳. اعتبارزدایی از مرجعیت سیاسی لیدرهای آفلاین و آنلاین

اساسا هر ابزاری، هر روشی، هر تکنولوژی که وارد یک بستر یا یک کشوری می‌شود، این که چقدر کار کند و جواب دهد، به یک‌سری اقتضائاتی در آن جامعه و کشوری ارتباط دارد. در داده‌کاوی و نظرسنجی در ایران زمینه‌ها و اقتضائات و پیش فرض‌های اجتماعی حتما در آن دخالت خواهد داشت.

موضوعاتی در انتخابات ریاست جمهوری ۱۴۰۳ به وجود آمد که آن را ویژه کرد. این‌که آن سانحه برای رییس جمهوری اتفاق بیفتد و انتخاباتی غیرمترقبه و غیرقابل پیش‌بینی و خیلی زودتر از زمان مقررش پیش آمد.

نکته دوم این‌که فراموش نکنیم شاهد این هستیم که انتخابات آمریکا یک پروسه یک تا دو ساله بصورت درون حزبی دارد در آن‌جا کارهایش انجام می‌شود و پیش می‌رود و فضا برای مردم روشن است. این‌که به چه کسی می‌خواهند رای بدهند؟ برنامه او چیست؟ معاونش کیست؟ معاون اولش کیست؟ ولی این‌جا به طور عادی اگر هم این ماجرا پیش نمی‌آمد و موضوع شهادت رییس‌جمهوری نبود، همیشه شاهد این هستیم که پس از بازه‌ چند ماهه در وزارت کشور و در میان مردم، در نهایت در یک بازه یک‌ماهه این فضا قرار است به یک جایی برسد. این خودش قضیه را با ابهاماتی روبه‌رو می‌کند.

در ایران به دلایل مختلف، فضای واقعی کنشگری، در فضای مجازی رخ می‌دهد

نکته دیگری که بسیار اساسی است و نباید فراموش کنیم، این است که ما با فقدان زمینه‌ها و اقتضائات کنش‌گری حزبی مواجه هستیم. این بسیار مهم است ما می‌گوییم فضای مجازی.
اما اتفاقا در ایران به تعبیری فضای واقعی در این‌جا است. به خاطر یک سری رفتارهای عرفی و رفتارهای فرهنگی ایرانیان و به خاطر ملاحظات حاکمیتی از طرف مردم، آن رفتار واقعی را خیلی از اوقات در این فضا که به آن فضای مجازی می‌گوییم، اتفاق می‌افتد و طبق بررسی‌هایی که دوستان ما در دیتاک و ما در لایف‌وب در سال‌های اخیر انجام دادیم، برآورد، پیش‌بینی و یا هرچیز دیگری که اسمش را بگذاریم خیلی نزدیک به واقعیت بوده است.

نیمه‌ای از جامعه رای دهنده‌ها تا صبح روز انتخابات هم مردد بودند که چه کسی قرار است به نفع دیگری کنار بکشد!

پس این را در نظر بگیریم که تحزب در کشور ما ساز و کار، زمینه‌ها و اقتضائاتش وجود ندارد و سرریزش را در جاهای مختلف مشاهده می‌کنیم. از جمله این پیش‌بینی رفتاری. نکته‌ دیگری که وجود داره اگر با جزئیات درباره انتخابات‌هایی که وجود داشته و به ویژه این انتخابات صحبت کنیم، در واقع ما دو طیف و جریان اصلی در کشور داریم، مشخصا آن جبهه و جریان اصلی که اسمش را جریان انقلابی بگذاریم، همچنان یک روحیه و فرهنگ و ساز و کاری برای یک کنش‌گری یکپارچه آن‌جا وجود ندارد و مشخصا ما کجای دنیا سراغ داریم که تا صبح روز انتخابات جامعه‌ای که قرار است رای بدهد هنوز فضا برایشان مبهم است و هنوز مردد هستند که آیا بالاخره یکی از این دو کاندید اصلی به نفع دیگری کنار می‌کشد یا نه؟

عوامل اختلال در پیش‌بینی‌های داده‌کاوی انتخاباتی چه بود؟
حمیدرضا کشاورز مدیرعامل شرکت لایف‌وب

اینها مسائل کمی نیستند که ما بخواهیم این ابهاماتی راکه آن طرف در فضای آفلاین وجود دارد را در واقع یک نیمه‌ای از جامعه رای دهنده‌ها تا صبح روز انتخابات هم مردد است که چه کسی قرار است به نفع دیگری کنار بکشد، این موضوع هم قطعا بی‌تاثیر نیست.

مدیرعامل لایف وب و دیتاک تاکید کردند: پراکندگی ضریب نفوذ اینترنت و نداشتن جامعه نرمال آماری، مهم‌ترین مشکلات داده‌کاوی در فضای مجازی است

ما چند نمونه مثل این سراغ داریم که جامعه رای‌دهنده با این ابهامات مواجه باشد، به قول آقای عسگری این ماجرای پراکندگی ضریب نفوذ اینترنت هم می‌تواند مزید بر علت باشد. می‌دانیم که در کشور یک فضای نرمال در پراکندگی نفوذ اینترنت نداریم، به زعم خیلی‌ها احتمالا کنش‌گری بخشی از مردم و درواقع عقیده‌هایشان و ایده‌هایشان نادیده گرفته می‌شود و ما داریم چه کاری انجام می‌دهیم؟

اگر عقیده‌کاوی انجام می‌دهیم اگر پایش افکاری انجام می‌دهیم نسبت به ظهور و بروز آن کاربرها انجام می‌دهیم. وقتی‌که امکانش ، فرصتش ، سواد رسانه‌ای اش، ابزارش و امکاناتش را برای این ظهور و بروز نداشته باشد احتمالا در سبد ما برای بررسی نیفتاده است.
یک دیدگاه دیگری هم وجود دارد که طبعا کسانی که دسترسی به اینترنت دارند، کنش‌گرند، سوادش را دارند و بلدند در این فضا ظهور و بروز داشته باشند و آن ها جزئی از خش تاثیرگذار جامعه هستند یعنی این نیست که فقط رای و نظر خودشان باشد یک شبکه از اطرافیان و دوستان و آشنایان و بستگانشان هم توانایی اثرگذاری دارند که می‌تواند آن بخش را پوشش دهند.

آباجان به نقل از ایرنا: طیف دوم کنشگران مجازی را بعد از طیف انقلابی و اصولگرا، تشریح بفرمایید؟

کشاورز: در آن‌طرف تکلیف خیلی روشن‌تر است یعنی یک قول معروفی هست که اگر یک چوب هم بگذارند کل آن فضا، کل آن تشکیلات، کل آن سمپاتشان می‌آید به سمتشان، تکلیف معلوم است و سازماندهی شده است.

مدیرعامل لایف وب تحلیل کرد: تشکیلات براندازی یک دست در مجازی وجود دارد در حالی که در جریان انقلابی و اصولگرا، چنددستگی آفت اصلی است

ولی در این فضای انقلابی و اصولگرایی و حالا جریان حزب‌اللهی و یا هر چیز دیگری که اسمش را بگذاریم این فضا اصلا وجود ندارد یعنی این مرجعیت فکری اینگونه بود یعنی در انتخابات ادوار گذشته دیده‌ایم که وجود ندارد و جامعه رای دهندگان را با یک ابهامی روبه‌رو می‌کند.

براساس پژوهش‌ها، لیدرهای فضای آفلاین در فضای آنلاین نمی‌توانند راهبری و اثربخشی داشته باشند

این موضوع را فراموش نکنیم که یکی از ویژگی‌های این پلتفرم‌ها، این عصر شبکه‌های مجازی، عصر دیجیتال این است که این شکل از رفتارهای حامی‌پیروی و سلسله‌مراتبی مشخصا در فضای آنلاین که کامل دارد اثرگذاری‌اش را از دست می‌دهد، یعنی مشخصا پژوهش‌های مختلف دارد نشان می‌دهد که آن لیدرهای فضای آفلاین در فضای آنلاین خیلی نمی‌توانند راهبری و اثربخشی داشته باشند. کما این که ما در فضای آفلاین هم می‌بینیم که مراجع ما چه در حوزه‌ اجتماعی، چه فرهنگی و چه سیاسی به دلایل مختلف به شدت اعتبارزدایی شده‌اند.

در انتخابات ۱۴۰۳، شاهد شورش صف علیه ستاد بودیم

مدیرعامل لایف‌وب مدعی شد: بخش وسیعی از مداحان و وعاظ از آقای قالیباف حمایت کردند ولی جامعه مخاطبانشان سمت آقای جلیلی رفتند

به طور مشخص، در همین انتخابات شاهد به تعبیری شورش صف علیه ستاد بودیم یعنی می‌دیدیم که این موضوع قابل کتمان نیست که تقریبا بخش وسیعی از مداحان و وعاظ که کنش‌گری آنها بیشتر مربوط به طیف اصولگرایی می‌شود به طور شفاف از آقای قالیباف حمایت کردند ولی جامعه مخاطبانشان سمت آقای جلیلی رفتند. یعنی این فضای سلسله‌مراتبی، حامی‌پیروی که می‌گوییم اثربخشی‌اش را از دست داده در انتخابات خیلی واضح خودش را نشان داد.

در ادامه این میزگرد و در بخش دوم، درباره تاثیرمتقابل و دیالکتیک نظرسنجی و داده‌کاوی و اصلی‌ترین چالش‌های داده‌کاوی در ایران نکات قابل تاملی مطرح شده است …

Check Also

جوانان و تحصیل‌کردگان دانشگاهی به هریس رای می‌دهند یا ترامپ؟

جوانان و تحصیل‌کردگان دانشگاهی به هریس رای می‌دهند یا ترامپ؟

مؤسسه افکارسنجی اطلس‌اینتل(AtlasIntel) که در سال ۲۰۲۰ نیز کم‌خطاترین نظرسنجی‌ها را درباره انتخابات ریاست جمهوری …

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *