شنبه ۱۳ اردیبهشت ۱۳۹۳ - ۰۰:۱۱
تلاش براي بومي کردن داده‌هاي بزرگ از طریق وب

تلاش براي بومي کردن ايجاد داده‌هاي بزرگ، محور اصلی سخنان حاضران در نشست تخصصی «داده‌هاي بزرگ و داده‌هاي پيوندي» بود که عصر امروز در نمایشگاه کتاب تهران برگزار شد.

به گزارش خبرگزاري كتاب ايران (ايبنا) دومین نشست تخصصی سرای کتاب و رسانه اهل قلم در سومین روز نمایشگاه بین‌المللی کتاب تهران به موضوع «داده‌هاي بزرگ و داده‌هاي پيوندي» اختصاص داشت. محسن حاجي‌زين‌العابديني، سید‌ ابراهیم عمرانی، دکتر سید مهدی طاهری و دکتر مهدی علیپور حافظی، در این نشست سخنرانی کردند. 

محسن حاجي‌زين‌العابديني، به‌عنوان مدیر نشست، در ابتدا پس از ذکر مقدمه‌ای از سخنرانان خواست تا تعريفي از داده‌هاي بزرگ و پيوندي ارايه كنند. وی افزود: مجموعه‌ داده‌هاي بزرگ و پيوندي مجموعه‌اي كلان است و نياز به بررسي بسياري در حوزه تخصصي دارد. اما در اين نشست این موضوع را كه داده‌هاي بزرگ چه ارتباطي با كتابشناسي دارند و يا اين‌كه چه ارزش افزوده‌اي را براي مخاطب به همراه مي‌آوردند مي‌توان با بازكردن مبحث داده‌هاي بزرگ به نتيجه رساند. 

داده‌های بزرگ با نرم‌افزارهای معمولی قابل پردازش نیست
سيدابراهيم عمراني، سرپرست سابق مركز اطلاعات و مدارك علمي ايران، به‌عنوان يكي از سخنرانان اين نشست، اظهار كرد: ساده‌ترين تعريف براي داده‌هاي بزرگ اين است كه داده‌اي كه اندازه آن به اندازه داده‌هاي پايه‌اي معمولي نباشد و خارج از حيطه داده‌هاي در جمع باشد، به عنوان داده بزرگ به شمار مي‌رود. اگر داده‌هاي پايه‌اي را با سلسله مراتب بشناسيم، متوجه مي‌شويم كه در طول روز با بسياري از داده‌هاي معمولي سر و كار داريم، اما بايد بدانيم داده‌هاي بزرگ با نرم‌افزارهاي معمولي قابل پردازش نيستند.

وي افزود: زماني كه اين داده‌ها از اندازه‌ خود بيشتر شوند و نتوان آن‌ها را با يك نرم‌افزار معمولي پردازش کرد نيازمند نرم‌افزارهايي هستيم كه بتوان آن‌ها را در اندازه‌هاي بزرگ پردازش كرد.

عمراني يادآور شد: ساده‌ترين مثالي كه براي اين مورد مي‌توانيم بياوريم شبكه‌هاي اجتماعي است در يك شبكه اجتماعي ميلياردها داده قرار دارد و به راحتي قابل پردازش نيستند و براي بارگذاري نياز به يك داده بزرگ داريم كه از اين طريق مي‌توان به كاربرد داده بزرگ پي برد. 


گاهی باید داده‌ها را از درون متن کشف کنیم
در ادامه اين نشست دكتر مهدي علي‌پور حافظي، کارشناس کتابداری و اطلاع‌رسانی، ضمن تاييد اظهارات عمراني عنوان كرد: بحث استفاده و ميزان بهره‌برداري از داده‌ها مي‌تواند بسيار حائز اهميت باشد. با ابزارهاي در دسترس نمي‌توان داده‌هاي بزرک را پردازش و كاربران را با مشكل مواجه كرد.

علي‌پور در ادامه به يكي از خصوصيت‌هاي اصلي داده بزرگ اشاره كرد و افزود: اغلب اوقات تصور بر اين است كه داده‌هاي بزرگ داراي ساختار و چارچوب مشخصي هستند، در صورتي‌كه گاهي ساخت نيافته بروز پيدا مي‌كنند. به‌عنوان مثال در يك متن خود را نشان مي‌دهند و ما بايد از داخل متن داده‌ها را كشف كنيم.

وي عنوان كرد: دو محور اصلي براي كشف داده‌ها قابل بيان است؛ يكي از اين محورها توصيف و كشف داده‌ها و محور دوم پيش‌بيني‌پذيري از بين داده‌ها است. براي اينكه بتوان داده‌هاي بزرگ را در مباحث دانشگاهي يا فراداده‌اي كه حجم قابل توجهي از داده‌ها را در بردارد تشخیص داد، بايد از اين دو محور استفاده كرد تا بتوان به چارچوب اصلي داده‌هاي بزرگ پي برد.

اين مدرس دانشگاه افزود: در كنار دو محور مذكور بايد تلخيص و بازنمايي داده‌ها را نيز در نظر بگيريم تا كار به مقصد نهايي نزديك شود. 

استفاده شرکت‌های بزرگ از فناوری وب برای دسترسی داده‌های بزرگ
در بخش دیگری از اين نشست تخصصی، دكتر سيدمهدي طاهري، مدرس دانشگاه نیز اظهار كرد: از سال 1993 ميلادي كه داده‌هاي بزرگ تعميم پيدا كردند، اكثر شركت‌ها و سازمان‌ها ترغيب شدند كه داده‌هاي خود را با استفاده از فناوري وب قابل دسترس كنند و اين امر تنها با استفاده از فناوري داده بزرگ امكان‌پذير بود. 

این کارشناس امور رایانه، با توضيح بيشتر پيرامون خاستگاه ايجاد داده‌هاي بزرگ و داده‌هاي پيوندي اظهار كرد: قابليت‌هاي موجود در داده‌هاي بزرگ به گونه‌اي است كه مي‌توان از طريق آن كارهاي بسيار كلان را انجام داد و داده‌هاي خرد را در آمار قابل توجهي در يك زمان معين منتشر كرد.

طاهري با اشاره به ويژگي خاستگاه داده‌هاي بزرگ گفت: حجم انتشار، سرعت انتشار، تنوع انواع داده‌ها و اعتبار و وصول داده‌هاي منتشر شده از جمله ويژگي‌هايي است كه مي‌توان از زمان بروز داده‌هاي بزرگ در سيستم رايانه‌اي مشاهده كرد.

به گفته وی حجم داده‌هاي بزرگ به مراتب و به مرور زمان بيشتر شدند و اين مساله با چالش مواجه شد و كارشناسان و متخصصان رايانه را برآن داشت تا آن را بازيابي و پردازش و بررسي كنند تا با يك مديريت تخصصي از چالش خارج كنند. 


اهمیت جمع‌آوري، نگهداري و پردازش داده‌هاي بزرگ 
دكتر محسن حاجی زين‌العابديني، نیز در ادامه اين نشست علمی، با مثالي ساده از پيشرفت تلفن‌هاي همراه اظهار كرد: در گذشته تلفن‌هاي همراه صرفا داده‌محور بودند و با مرور زمان مولتي مديا به آن اضافه شد و بعد از آن مولتي مدياي پيشرفته و با كيفيت روي كار آمد و بعد از اضافه شدن دوربين‌هايي كه حجم و ظرفيت‌ پردازنده بالا و چند هسته‌اي نياز داشتند، توليد شد.

وي افزود: جمع‌آوري، نگهداري و پردازش داده‌هاي بزرگ بسيار حايز اهميت است و كاربر از طريق روش صحيح اين فرايند مي‌تواند داده‌هاي بزرگ را به بهترين شكل استفاده كند بر اين اساس درباره داده‌هاي بزرگ مي‌توان گفت از يك سو براي مخاطب موهبت هستند زيرا اطلاعات بزرگ را پردازش و قابل استفاده مي‌كنند و از سوي ديگر معضل هستند باعث مي‌شوند بازيابي دقيقي از اطلاعات نداشته باشيم.

زين‌العابديني یادآور شد: بحث عمده‌اي كه درباره داده‌هاي پيوندي وجود دارد اين است كه روزانه توسط افراد مختلف در وب توليد مي‌شوند و تغيير مي‌كنند كه اين داده‌ها هرچند نمي‌توانند قابل اطمينان باشند اما به دليل حجم بالايي كه دارند نياز به داده‌هاي بزرگ براي پردازش دارند. 

بايد به داده‌هاي بزرگ به‌عنوان فرصت نگاه کرد
در بخش دیگری از نشست، سید مهدی طاهري، با ايجاد اين سوال كه داده بزرگ فرصت است يا تهديد گفت: طي 4 سال قبل داده برگ يك چالش بود و زماني كه متخصصان به‌طور جدي روي آن كار كردند به اين نتيجه رسيدم كه بايد به داده‌هاي بزرگ به‌عنوان فرصت نگاه شود.

وي افزود: در اين داده‌ها مي‌توان منابعي را تهيه كرد و با استناد به آنها درخواست مخاطب را در زمينه اطلاعاتي برآورده كرد همچنين يكي از كاربردهاي داده‌هاي بزرگ سيستم‌هاي پشتيباني هستند.

در ادامه عمراني از بعد فني به موضوع نشست نگاه كرد و افزود: اين بحث در عين فني بودن در مباحث ريزتر به نكات سياسي و اجتماعي توجه دارد و مخاطبان بايد با دقت و تمركز تمام اقدامات در روي داده‌ها را انجام دهند. به گونه‌اي كه تصور كنند اين روند مبارزه با دنيا است و به راحتي با جستجوي هر گونه مطلبي خود را به جهان معرفي نكنند. 

این کارشناس کتابداری و اطلاع‌رسانی، به گزينه‌هاي اطلاعاتي روز دنيا يعني ويكي‌پديا و آمازون اشاره كرد و گفت: اين سايت‌هاي اطلاعاتي هرچند از نگاه فني راه‌اندازي شدند اما افرادي در زيرمجموعه آن قرار دارند كه به دنبال ايجاد مباحث سياسي و اجتماعي هستند و اين نبايد از نگاه كاربران غافل بماند. 

توجه به فضای ابری در زمینه امنیت اطلاعات
زين‌العابديني در ادامه به مساله فضاي ابري اشاره كرد و گفت: فضاي ابري همان ابرهاي اطلاعاتي هستند كه مي‌توانند در آن به امنيت اطلاعات شخصي اشاره كنند و اين امر از طريق داده‌هاي پيوندي امكان‌پذير مي‌شود به عبارت ديگر داده‌هاي پيوندي زيرمجموعه داده‌هاي بزرگ هستند زيرا به پردازش اطلاعات كمك مي‌كنند. 


عمراني در واكنش به اين سخنان زين‌العابديني گفت: در ابتدا از كتابخانه‌ها براي پردازش اطلاعات استفاده مي‌شد اما به مرور زمان كامپيوترمن‌ها روي كار آمدند و داده‌ها را تعريف كردند، اين در حالي است كه در بحث نرم‌افزارها داده‌هاي سامان‌يافته هر روز در حال تغيير است و هرچه هر كتابخانه‌اي براي به روز رساني آن پويا باشد، بازهم كافي نخواهد بود. 

ایجاد داده‌های پیوندی با هدف سرعت‌بخشی در انتقال اطلاعات  
دکتر علیپور نیز در ادامه با تایید اظهارات عمرانی بیان کرد: داده‌های پیوندی با هدف سرعت‌بخشی در انتقال اطلاعات ایجاد می‌شوند و برای مثال می‌توان به ویکی پدیا اشاره کرد که با داده‌های پیوندی، اطلاعات بسیاری را در اختیار افراد قرار می‌دهد. 

طاهری نیز در تکمیل اظهارات علیپور، از دو خواستگاه اصلی از داده‌های پیوندی یاد کرد و افزود: دو عامل هستی‌شناسانه و مفهومی و عامل ساختارمند کردن از مهمترین عواملی هستند که می‌توان از طریق آن به داده‌های پیوندی جامع و در نهایت به داده‌های بزرگ رسید.
 
وی ادامه داد: پردازش داده‌ها زمانی رخ می‌دهد که بین آنها ارتباط برقرار شود که در این بین بافت مدیریت کتابخانه‌ای عنوان می‌کند که زمانی اطلاعات داده می‌شوند که پردازش شوند. 

طاهری گفت: هم اکنون شاهد هستیم بافتی که وجود دارد، درباره داده‌های بزرگ بافت کتابخانه‌ای است که الگوی آن در بافت کتابخانه ساخته شده و ارتباط را برقرار می‌کند. 

کاربران امروزی هوشمند هستند
زین‌العابدینی این بحث را ادامه داد و گفت: هم اکنون ما در کتابخانه‌ها تغییر و تحولی هم در نوع و هم در کیفیت داده‌ها داشتیم که با یک بازیابی محتوایی ساده می‌توان به جزئیات آن پی برد. 

وی کاربران امروزی را کاربرانی هوشمند دانست و ادامه داد: هم اکنون جستجوی اطلاعات یک کتاب در کتابخانه امری پیش پا افتاده تلقی می‌شود و باید با توجه به ورود داده‌های بزرگ و پیوندی، به تحلیل جدی و قدرتمند اطلاعات کتاب‌های موجود در کتابخانه‌ها دست یافت.
 
کامپیوترمن‌ها به عرصه جامعه آمده‌اند
زین‌العابدینی از سایر سخنرانان حاضر خواستار ارایه راهکاری برای بازیابی محتوایی به شیوه داده‌های بزرگ و پیوندی شد که عمرانی با استناد به مثال ویکی پدیا و آمازون گفت: کتابخانه‌ها باید به این باور که کامپیوترمن‌ها به عرصه جامعه آمده‌اند، برسند و در نهایت روزی برسد که بگوییم وب سمت سامان یافتن و بازیابی محتوایی رفته است و ابر اطلاعاتی بر تمام کتابخانه‌ها پوشانده شدند. در حقیقت روزی می‌رسد که کاربر با مراجعه به یک مرجع کتابداری، می‌توانند با پیوندهای مرتبط به تمام اطلاعات مورد نیاز دست یابد. 

زین العابدینی هم با یادآور شدن این مطلب که تمام دنیا برای مشاهیر خود اطلاعات جامع و در دسترسی در وب آماده دارند، متخصصان و حتی افراد عادی جامعه را به سمت ایجاد فضای اطلاعاتی و ارطلاع‌رسانی برای مشاهیر کشورمان دعوت کرد. 

وی همچنین از قرار گرفتن اطلاعات مشاهیر جمهوری اسلامی ایران در فهرست اطلاعاتی دنیا ابراز امیدواری کرد و افزود: امیدواریم روزی مرز اطلاعاتی در وب شکسته شود و نام مشاهیر خود را در فهرست مشاهیر دنیا ببینیم. 

تهیه داده های بزرگ و مفید برای ایجاد ارتباط بین انسان‌ها 
علیپور حافظی، نیز با هدایت موضوع نشست به سمت معنادار شدن داده‌های بزرگ و پیوندی، گفت: افراد با حجم اطلاعات وسیعی مواجه هستند که روش‌های مختلفی برای پردازش آن وجود دارد. یکی از این روش‌ها، تهیه داده‌های بزرگ و مفید است. 

وی افزود: برای اینکه روابط مفهومی و ارتباطی بین انسان‌ها ایجاد شود نیاز به زمینه‌ای از اطلاعات است که باید به مراتب تکمیل شود. 

این مدرس دانشگاه همچنین یکی از روش‌های موجود پیرامون بحث داده‌های پیوندی را اینگونه توضیح داد که داده‌های پیوندی باید مبتنی بر چارچوب معنایی مفهومی ایجاد شود و برای اینکه پیوند اطلاعاتی محقق شود باید شبکه‌ای از مفاهیم را به این شکل در کنار هم قرار داده و مرتبط کنیم. 

اطلاعات و داده‌های ما باید شناسنامه‌دار شوند
زین‌العابدینی در تکمیل اظهارات علیپور گفت: اطلاعات و داده‌ها برای مخاطب نیز باید دارای شناسنامه شوند تا بتوانیم در بین داده‌های بزرگ جهانی دارای جایگاه شویم. 

طاهری هم در سخنان پایانی خود گفت: در صورتی‌که نگاه کنیم حرکت داده‌ها به چه سمتی می‌رود می‌توانیم به گسترده شدن اطلاعات برسیم اما پیش از هر نکته‌ای باید به یکی بودن خواستگاه داده‌های بزرگ و داده‌های پیوندی پی ببریم. 

زین‌العابدینی نیز با بیان اینکه داده‌های تفکیک شده امکان پردازش اطلاعات را بیشتر می‌کند، تاکید کرد: ما برای تولید داده‌های بزرگ الگوهایی نیاز داریم که بومی شوند زیرا بسیاری از الگوهای موجود در وب، از فرهنگ و زبان فارسی و ایرانی فاصله دارد. 

وی در پایان در نتیجه‌گیری این نشست گفت: کتابدارها هر چه داده‌ها را هدفمند تولید کنند، داده‌های غنی‌تری خواهند داشت. 

این کارشناس مساله دیگر را تغییر نوع رویکرد افراد به اطلاعات عنوان کرد و افزود: در گذشته این شیوه به این شکل بود که اطلاعات از طریق چاپگر به دست افراد می‌رسید اما امروز با پردازش سریع اطلاعات از طریق رایانه دیگر نیاز به چاپگر نبوده و حتی گاهی سیاست‌گذاری از طریق کاربران انجام می‌شود.

نظر شما

شما در حال پاسخ به نظر «» هستید.

برگزیده

پربازدیدترین

تازه‌ها