تعبیر داده‌شناس سابق گوگل از اهمیت بیگ‌دیتا و رفتارشناسی داده‌محور میلیاردها کاربر

پارادوکس‌ «همه دروغ می‌گویند»

عباس پورخصالیان

پارادوکس‌ «همه دروغ می‌گویند»

این یادداشت، حاصل بررسی کتاب‌ «همه دروغ می‌گویند» است؛ کتابی نوشته شده توسط داده‌کاو سابق‌ شاغل در مرکز تحقیقات شرکت گوگل به نام "س‌ث است‌ف‌نز-دیویدُویتز"

نقش روی جلد کتاب را گویی فردی که زبان فارسی می‌دانسته طراحی کرده زیرا گویای تعبیری خودمانی از عنوان کتاب است، به معنی‌ «همه ساده‌ راه‌راه‌اند»!

آشنایی با دکتر س‌ث است‌ف‌نز-د‌یویدُویتز

س‌ث که معادل‌ فارسی آن در ادبیات مذهبی ما، "شیث"، هم‌نام با نام پسر سوم حضرت آدم (ع) است، در سال ۱۹۸۲ در خانواده‌ای یهودی در آمریکا متولد شد؛ در سال 1999 دیپلم گرفت و سپس در رشته‌ فلسفه در دانشگاه استنفورد پذیرفته شد و پس از اخذ درجه‌ لیسانس (B A) از آن دانشگاه، در رشته‌ اقتصاد در دانشگاه هاروارد به تحصیل ادامه داد و در سال 2013 درجه‌ دکترای را خود در این رشته دریافت کرد.

س‌ث متخصص در رشته‌های داده‌شناسی، رفتارشناسی کاربران (با استفاده از داده‌کاوی و تحلیل‌شناسی داده‌های "گوگل‌تر‌ندز") و اکنون استاد میهمان در مدرسه عالی «و‌رنُن» است. کتاب «همه دروغ می‌گویند» نخستین اثر او است.

س‌ث تا پیش از چاپ این کتاب در سال 2017، در مرکز تحقیقات گوگل به داده‌شناسی و تحلیلگری در کلان‌داده‌های «گوگل‌تر‌ندز» مشغول بود و وظیفه‌اش در مرکز تحقیقات گوگل و هدفش از پژوهش در کلان‌داده‌های «گوگل‌تر‌ندز» رسیدن به روش علمی‌ جدیدی برای پایه‌گذاری رفتارشناسی‌ داده‌محور‌ کاربران فضای سایبر بوده است.

 

 آشنایی با گوگل‌ترندز

جمعیت هدف در پژوهش س‌ث، میلیاردها انسان معاصر (از آن جمله شما و من) را شامل می‌شود زیرا مستند رفتاری هرکدام از ما کاربران جویشگر گوگل، طی 13 سال اخیر از 2004 تا 2017 (یعنی از سال راه‌اندازی جویشگر گوگل تا سال تالیف کتاب مورد بحث) بخشی از بیگ‌دیتای «گوگل‌ترندز» را با حجمی بالغ بر 8 تریلیون گیگابایت تشکیل می‌دهد.

پارادوکس‌ «همه دروغ می‌گویند»

لوگوی گوگل‌ترندز

 

«گوگل‌تر‌ندز» یکی از سرویس‌های برخط‌ شرکت گوگل است که اطلاعاتی در مورد روندهای زمانی و بسامدی جست‌وجوی هر کلیدواژه توسط کاربران‌ موتور جست‌وجوی گوگل را به صورت گرافیکی به دست می‌دهد اما چندین برابر‌ اطلاعاتی را که کاربر معمولی از گوگل‌ترندز به ا‌زای هر پرسش (Query) دریافت می‌کند، پژوهشگران مرکز تحقیقات گوگل با داشتن دسترسی مستقیم به برنامه‌های کاربردی/تخصصی برای کار با ماشین‌های یادگیری (LM)، از درون بیگ‌دیتای گوگل‌تر‌ندز استخراج و پردازش می‌کنند.

به‌خاطر اهمیتی که بیگ‌دیتای حاصل از کلیدواژه‌ها و پرسش‌های کاربران برای مدیریت شرکت گوگل داشت (و دارد)، ایراداتی که در سرویس قبلی گوگل (به نام Google Insights for Search، فعال از سال 2004 تا 2012) مشاهده شده بود، این ایرادات در نسل بعدی سرویس مذکور رفع شد، فعالیت آن در تاریخ 27 سپتامبر 2012 متوقف شد و بیگ‌دیتای آن در بیگ‌دیتای سرویس «گوگل‌تر‌ندز» ادغام شد.

 

ویژگی‌های کتاب‌ «همه دروغ می‌گویند»

این کتاب، توسط موسسه‌ هارپر کالینز در سال 2017 منتشر و به پرفروش‌ترین کتاب نیویورک‌تایمز تبدیل شد و در همان سال‌ انتشار، توسط اکونومیست و «PBS NewsHour» که پربیننده‌ترین برنامه‌ خبری یک‌ساعته‌ شبکه‌ رادیوتلویزیونی آمریکا است، به‌عنوان کتاب سال معرفی شد.

فهرست مطالب کتاب «همه دروغ می‌گویند» می‌تواند گستره‌ موضوعی آن را نشان دهد.

فهرست مطالب کتاب «همه دروغ می‌گویند»

]توضیحات داخل بین‌الهلالین از نگارنده‌ این یادداشت است [

• احساس شکمی معیوب شما ("احساس شکمی"، یعنی برداشت احساسی/هیجانی از امور به جای تامل و تفکر علمی در آنها)

• آیا «فروید» مُحق بود؟ (زیگموند فروید، یهودی اتریشی‌تبار در سال 1900 کتاب «تعبیر رویا» را که با نوآوری «روان‌کاوی» حاصل شده بود، منتشر کرد و هم‌کیش وی: س‌ث است‌ف‌نز-دیویدُویتز، 117 سال بعد، کتاب‌ "«همه دروغ می‌گویند» را که از نوآوری «رفتارشناسی داده‌محور» بنیاد گرفته است)

• بازپنداری‌ داده‌ها

• بدن‌ها (یا انسان‌ها) به‌مثابه‌ داده‌ها

• کلمات به‌مثابه‌ داده‌ها

• تصاویر به‌مثابه‌ داده‌ها

• سرُم‌ حقیقت دیجیتالی

• حقیقت در مورد جنس (مذکر، مونث یا دگرباش بودن کاربر)

• حقیقت در مورد (ژرفای و گسترش) نفرت و پیش‌داوری

• حقیقت در مورد اینترنت

• حقیقت در مورد کودک‌آزاری و سقط جنین

• حقیقت در مورد دوستان فیس‌بوکی شما

• حقیقت در مورد مشتریان‌تان

• آیا می‌توانیم حقیقت را مهندسی کنیم؟

• بزرگنمایی (با تمرکز بر جزيیات)

• در کشور، شهرها و محلات شما چه می‌گذرد؟

• چگونه دقایق و ساعات‌ زندگی‌مان را پر می‌کنیم؟

• من‌ دیگر‌ مشابه ما

• داده‌سرگذشت‌ها (تاریخچه‌ هر داده)

• همه‌ جهان، یک آزمایشگاه‌ (بزرگ‌ داده‌بنیان است)

• الفبای آزمون‌ A/B (مقایسه‌ داده‌محور‌ عملکرد دو الگوی مشابه)

• طبیعت بی‌رحم

• روشنگری به شرط‌ها و شروطها

•‌آزمایش‌ها

• «هرکه بیگ‌دیتایش بیش، بارش بیشتر؟» آنچه بیگ‌دیتا نمی‌تواند انجام دهد

• نفرین اندازه‌پذیری (دادگان با ابعاد فوق‌ بزرگ)

• تاکید بیشتر بر آنچه قابل اندازه‌گیری (و میسر) است

• (پرسش از) بیگ‌دیتا (به‌مثابه‌) مساله‌ بزرگ؟ و آنچه را که نباید انجام دهیم

• خطر شرکت‌های قدرتمند شده (با رسیدن به دانش حاصل از تحلیل‌شناسی بیگ‌دیتا.)

 

«همه دروغ می‌گویند» عنوانی متناقض‌نما یا پارادوکسیال

فیلسوفان و منطقیون، از 2200 سال پیش تاکنون، پارادوکس‌های متعددی را وضع کرده‌اند، مثل‌: «می‌دانم که نمی‌دانم»، «گزاره‌ بعدی راست است، اما گزاره‌ قبلی دروغ است» و همین عنوان کتاب مورد بحث: «همه دروغ می‌گویند» که درک آنها برای ما سرگیجه‌آور است زیرا اغلب به جایی نمی‌رسیم! نویسنده‌ کتاب: دکتر س‌ث است‌ف‌نز-دیویدُویتز نیز همان‌طور كه ذكر شد در دانشگاه استنفورد، فلسفه خوانده است پس او نیز با آگاهی از بار‌ پارادوکسیال‌ بودن عبارت‌: «همه دروغ می‌گویند» نخستین کتاب خود را چنین نامیده است تا حل معمای کتابش را به عهده‌ خوانندگانش بگذارد.

 

«همه دروغ می‌گویند» را چگونه باید فهمید؟

- در حالت یکم: اگر قید «همه» را در عنوان کتاب: «همه دروغ می‌گویند» به معنی همه‌ افراد یا همه‌ انسان‌ها در نظر گیریم، می‌توانیم بگوییم: این گزاره در مورد نویسنده‌ کتاب نیز صادق است، لذا دکتر س‌ث است‌ف‌نز-دیویدُویتز نیز دروغ می‌گوید؛ زیرا شخص وی، یکی از افراد تشکیل‌دهنده‌ «همه‌» افراد است؛ و چون برای درک درست ادعاهای فرد دروغگو، گزاره‌های وی را نفی می‌کنیم، باید گزاره‌ «همه دروغ می‌گویند» را (به شرط آنکه منظور از «همه» همه‌ افراد یا همه‌ انسانها باشد) به یکی از سه شیوه‌ زیر نفی کنیم تا به حقیقت ادعای وی پی ببریم.

• «همه دروغ نمی‌گویند» بلکه حقیقت را کتمان می‌کنند ولی در هر حال، داده‌کاو و تحلیل‌شناس‌ بیگ‌دیتا در نهایت اسرار را فاش و از رفتارها رمززدایی می‌کند.

• «همه راست می‌گویند» ولی اگر گاه به ضرورت یا به خاطر عزت نفس، دروغ هم بگویند، فرقی نمی‌کند، بیگ‌دیتا نماینده‌ زمینی/تکنولوژیکی «دانای مطلق» است.

• «نَه همه دروغ می‌گویند» بلکه برخی دروغ می‌گویند، اما هیچ‌کس نمی‌تواند به بیگ‌دیتا دروغ بگوید. بیگ‌دیتا کاشف‌القطاع (کنار زننده‌ پرده‌ها و حجاب‌ها) است.

- در حالت دوم، اگر منظور نویسنده از «همه» همه‌ موجودات باشد (همچنان که طراح نقش روی جلد کتاب نیز حیوانات «راه‌راه شده» را زیر عنوان‌ «همه دروغ می‌گویند» به تصویر کشیده است!) مصادیق و مضامین‌ «همه»، چیز‌های طبیعی و مصنوعی را نیز شامل می‌شود، آن‌وقت نتیجه می‌گیریم که بیگ‌دیتا، ماشین یادگیری و هوش مصنوعی هم در نهایت خارج از دایره‌ اطلاق این گزاره نیستند و آنها هم

- دروغ می‌گویند یا حداقل نمی‌توانند همیشه به ما راست بگویند.

 

آنچه باید مورد تاکید قرار گیرد

1. از پارادوکسیال بودن عنوان کتاب مذکور بگذریم، می‌رسیم به ادعای نویسنده‌ آن: این اثر، مقدمه‌ای است بر «علم رفتار‌شناسی داده‌محور کاربران». این ادعای بزرگ را کارشناسان فاوا نمی‌توانند رد یا قبول کنند. تنها رفتارشناسان، مردم‌شناسان، جامعه‌شناسان، روان‌شناسان بالینی، روان‌پزشکان و دانشمندان علوم شناختی می‌توانند آن را تایید یا تکذیب کنند! نمی‌دانم چرا هنوز چنین اتفاقی نیفتاده است. آیا رفتارشناسان، مردم‌شناسان وغيره به خود جرات ورود به بحث را نمی‌دهند؟

2. موضوع مهم این کتاب از نظر نویسنده‌ کتاب (و نگارنده‌ این یادداشت) این است که:

 افراد به‌ هنگام پرکردن پرسش‌نامه‌های تحقیقاتی‌ طرح شده در یک پیمایش‌ آکادمیک، به‌هنگام پاسخ دادن به سوالات استاندارد پرسش‌نامه‌های تحقیقاتی، چندان صادق نیستند، اغلب دروغ می‌گویند و همین پاسخ‌های دروغ مبنای پیمایش‌ها و زیربنای نظریه‌هایی (نادرست) قرار می‌گیرند در حالی که کاربران به ‌هنگام جست‌وجوی کلیدواژه‌ها در اینترنت، به‌صورتی ناخودآگاه، رازهای پنهان و طبیعت واقعی خود را رو كرده زیرا فکر می‌کنند که جست‌وجو کردن، اغلب یک فعالیت خصوصی است و نتایج جست‌وجو نیز خصوصی باقی می‌مانند.

3. س‌ث است‌ف‌نز-دیویدُویتز به درستی می‌گوید:

پیش‌فرض‌ «جست‌وجو کردن به‌عنوان یک فعالیت خصوصی»، خطای بزرگ اغلب کاربران است.

4.  وجود این داده‌ها در مراکز داده‌ گوگل به زیان‌ شرکت‌ها، به ضرر‌ نهادهای دولتی و به سود همه‌ کسانی است که کلیت این داده‌ها را در اختیار دارند (یا قسمتی از آن را در اختیار می‌گیرند) و به یاری فنون تحلیل‌شناسی (analytics)، به واقعی‌ترین دانش رفتارشناختی کاربران دست می‌یابند.

5. به باور وی (که به راحتی می‌توان آن را پذیرفت):

کارکرد کلان‌داده‌های گوگل‌ترندز، مانند کارکرد کلان‌داده‌های رقبای گوگل‌ترندز و صاحبان رسانه‌های اجتماعی، این است که می‌تواند مانند‌ داروی اعتراف‌گیری (Thiopental) از میلیاردها کاربر خطاکار، عمل کند.

6. او دلسوزانه توصیه می‌کند که:

 مدیران، روسا و کاربران، در رویکرد جست‌وجوگری خود تجدید نظر کنید.

و نگارنده‌ این یادداشت، بر توصیه‌های وی مایل است بیفزاید که:

7. مدیران فناوری اطلاعات و اعضای محترم شورای‌عالی فضای مجازی، در زمینه‌ ایجاد جویشگر ملی و جویشگرهای تخصصی قوی مورد نیاز تخصص‌های باند باریک، سیاست‌گذاری و همکاری کنید.

8. از جویشگری که ارزش صفت‌ «ملی» و «جهانی» را داشته باشد در خیلی از کشورها (به جز آمریکا و چین) اثری نیست!

9. آیا تا کنون یک سند سیاستی در مورد جویشگر ملی کشور دیده‌اید؟ اگر شما خواننده‌ گرامی، چنین سندی را دیده‌اید، نگارنده را هم از غفلت درآورید.