همراه ما باشید
هفته نامه عصر ارتباط
اولیـن و پرتیـراژتـرین هفتـه نـامه ICT کشـور

گزارشي از نخستين نشست پيرامون «علم داده»

عباس پورخصاليان

 

نخستين نشست «علم داده» در حسينيه ارشاد، روز شنبه 11دي ماه 95 با نمايشگاهي از منابع کتابخانه­اي مرتبط با موضوع «علم داده» و ميزگردي به رياست دکتر مصطفي اميني برگزار شد که مهندس ياسر قليش‌لي از شرکت «فراز پردازش پديسار» و دکتر داريوش عليمحمدي، عضو هيات علمي ‌دانشگاه خوارزمي‌ سخنرانان آن بودند و هر يک از کارشناسان حاضر، ديدگاه‌هاي خود را به شرح زير مطرح کردند.

*دکتر داريوش عليمحمدي: در حال حاضر شواهدي براي تمرکز بر علم داده وجود دارد. نخست اينکه حجم داده‌ها در خلال سال‌هاي اخير بيشتر شده و اين روند افزايشي سرعت بيشتري به خود گرفته است. دوم آنکه يک جابه‌جايي رخ داده و توليدکنندگان داده ديگر، متخصصان برجسته شرکت‌ها و دانشگاه‌ها نيستند. الان افراد با هر تخصص و در هر سطحي مشغول توليد داده هستند. سوم ماهيت علمي ‌بسياري از داده‌هايي است که همه‌روزه در محيط‌هاي الکترونيکي در دسترس قرار مي‌گيرند. در واقع انباشت داده علمي‌ شکل‌گيري علم داده را ضروري ساخته است. نکته چهارم اين است که داده‌ها از لحاظ مفهومي‌ از نوع نرم به نوع سخت دارند تغيير ماهيت مي‌دهند. قبلا مفاهيمي ‌مانند بازنمايي و مصورسازي حرف اول را در حوزه بازيابي مي‌زدند. تحت آن شرايط و به اعتبار مفهوم ما با وجوه انساني داده‌کاوي و داده‌يابي هم روبه‌رو مي‌شديم، اما الان مفاهيمي ‌سخت و مبتني بر رياضي و آمار همچون کلان‌داده حرف اول را مي‌زنند. اين مفاهيم زاييده و منعکس‌کننده وضعيت دشواري هستند که حلش منوط به استفاده از جنبه سخت علم يعني رياضي است. نکته آخر هم آن است که يک هم‌راستايي وجود دارد ميان مفهوم کلان‌داده و علم داده. علم داده تقريبا هم‌زمان و هم‌راستا با کلان‌داده رشد کرده و يکي از اصلي‌ترين اهدافش حل مساله کلان‌داده‌ها بوده است. به هر حال گفته مي‌شود که علم داده نقطه مشترک علوم/مهندسي کامپيوتر و علم آمار است همراه با نگاهي کلان به هر دو. البته در اين ميان با علم اطلاعات و رياضيات هم نسبت‌هايي دارد. يک عالم داده بايد بيشتر از يک آماردان آمار بداند و بيشتر از يک مهندس کامپيوتر نرم‌افزارنويسي را بداند.

به همين اعتبار آموزش علم داده در دانشگاه‌ها که البته خيلي جوان است در دوره فوق‌ ليسانس انجام مي‌شود. الان در معدود دانشگاه‌هايي در غرب دارند روي برنامه ليسانس علم داده نيز کار مي‌کنند. اما واقعيت اين است که در اين مسير مشکلات زيادي دارند. علتش اين است که اينها به اندازه کافي محتوا براي برنامه ليسانس علم داده ندارند. در عين حال و بنا به اعتراف خودشان مشکل نظريه نيز دارند.

پيشتازان علم داده خود معترف‌اند که فلسفه اطلاعات، نظريه اطلاعات و نظريه احتمالات را بايد بيشتر به کار بگيرند تا بتوانند غناي نظري علم داده را تضمين کنند. آموزش علم داده با توفيقات و دشواري‌هاي کنوني‌اش در دانشگاه‌ها انجام مي‌شود **تا مهارت‌هاي انساني مانند شناخت حوزه تحت بررسي، خلاقيت مديريت پروژه، تضمين کيفيت، استدلال اخلاقي و ارتباط انساني در کنار مهارت‌هاي فني نظير برنامه‌نويسي پايگاه‌هاي اطلاعاتي، رابطه‌اي، داده‌کاوي، يادگيري ماشيني، مصورسازي و مساله‌يابي در تربيت‌شدگان اين رشته ايجاد شود.** به‌طور کلي گفته مي‌شود که علم داده بر چهار مقوله تمرکز مي‌کند: 1) معماري سيستم، 2) فراهم‌آوري داده، 3) تحليل داده و 4) بايگاني داده. آن مهارت‌ها بايد در چارچوب چهار مقوله مذکور به‌کار گرفته شوند.

* مهندس ياسر قليش‌لي: جهان امروز با حجم غيرقابل باور داده‌ها شامل داده‌هاي علمي، شبه‌علمي ‌و غيرعلمي ‌در طول روز روبه‌رو ست. اين اتفاق در صنايع گوناگون با وضعيت سريع‌تر و حجيم‌تري در حال پيشرفت است. يکي از مهم‌ترين صنايعي که با بيشترين حجم داده‌ها سروکار دارد و همچنين داده‌هاي بسياري را توليد مي‌کند، صنعت بانکداري است.

استفاده از علم داده براي بهبود وضعيت، افزايش کيفيت، کاهش هزينه‌ها و افزايش درآمدها و سودآوري، بسيار حايز اهميت است و استفاده نكردن از اين علم باعث شکست صنايع درميان‌مدت و حتي کوتاه‌مدت خواهد شد. فرايند گذار از داده‌هاي خام و دستيابي به خِرد (Wisdom) که منجر به تصميم و فعاليت مي‌شود، شامل مراحل «گردآوري داده‌ها»، «درک و فهم»، «آماده‌سازي براي تحليل»، «تحليل»، «ارزيابي» و در نتيجه «دانش و عمل» است. از اين فرايند در صنايع گوناگون بالاخص در صنعت بانکداري در لايه‌هاي «فروش و بازاريابي»، «مديريت ريسک»، «امنيت و مقابله با کلاهبرداري»، «قانون‌گذاري»، «مديريت هزينه» و «دسته‌بندي مشتريان» استفاده مي‌شود.

در واقع بانک پس از تعريف يک خدمت يا محصول، داده‌هاي مشتريان و کسب‌وکار را تحليل كرده و بر آن اساس مدل آينده‌نگري و آينده‌نگاري خود را به‌گونه‌اي ترسيم مي‌کند که نهايتا منجر به بهينه‌سازي راهبرد آينده مي‌شود. در واقع يکي از مهم‌ترين کاربردهاي علم داده، (از ميان همه کاربردهاي متنوعش) ترسيم خط مشي آينده يک بانک است.

 

درج دیدگاه

بررسی بازی