به گزارش خبرگزاري كتاب ايران (ايبنا) دومین نشست تخصصی سرای کتاب و رسانه اهل قلم در سومین روز نمایشگاه بینالمللی کتاب تهران به موضوع «دادههاي بزرگ و دادههاي پيوندي» اختصاص داشت. محسن حاجيزينالعابديني، سید ابراهیم عمرانی، دکتر سید مهدی طاهری و دکتر مهدی علیپور حافظی، در این نشست سخنرانی کردند.
محسن حاجيزينالعابديني، بهعنوان مدیر نشست، در ابتدا پس از ذکر مقدمهای از سخنرانان خواست تا تعريفي از دادههاي بزرگ و پيوندي ارايه كنند. وی افزود: مجموعه دادههاي بزرگ و پيوندي مجموعهاي كلان است و نياز به بررسي بسياري در حوزه تخصصي دارد. اما در اين نشست این موضوع را كه دادههاي بزرگ چه ارتباطي با كتابشناسي دارند و يا اينكه چه ارزش افزودهاي را براي مخاطب به همراه ميآوردند ميتوان با بازكردن مبحث دادههاي بزرگ به نتيجه رساند.
دادههای بزرگ با نرمافزارهای معمولی قابل پردازش نیست
سيدابراهيم عمراني، سرپرست سابق مركز اطلاعات و مدارك علمي ايران، بهعنوان يكي از سخنرانان اين نشست، اظهار كرد: سادهترين تعريف براي دادههاي بزرگ اين است كه دادهاي كه اندازه آن به اندازه دادههاي پايهاي معمولي نباشد و خارج از حيطه دادههاي در جمع باشد، به عنوان داده بزرگ به شمار ميرود. اگر دادههاي پايهاي را با سلسله مراتب بشناسيم، متوجه ميشويم كه در طول روز با بسياري از دادههاي معمولي سر و كار داريم، اما بايد بدانيم دادههاي بزرگ با نرمافزارهاي معمولي قابل پردازش نيستند.
وي افزود: زماني كه اين دادهها از اندازه خود بيشتر شوند و نتوان آنها را با يك نرمافزار معمولي پردازش کرد نيازمند نرمافزارهايي هستيم كه بتوان آنها را در اندازههاي بزرگ پردازش كرد.
عمراني يادآور شد: سادهترين مثالي كه براي اين مورد ميتوانيم بياوريم شبكههاي اجتماعي است در يك شبكه اجتماعي ميلياردها داده قرار دارد و به راحتي قابل پردازش نيستند و براي بارگذاري نياز به يك داده بزرگ داريم كه از اين طريق ميتوان به كاربرد داده بزرگ پي برد.
گاهی باید دادهها را از درون متن کشف کنیم
در ادامه اين نشست دكتر مهدي عليپور حافظي، کارشناس کتابداری و اطلاعرسانی، ضمن تاييد اظهارات عمراني عنوان كرد: بحث استفاده و ميزان بهرهبرداري از دادهها ميتواند بسيار حائز اهميت باشد. با ابزارهاي در دسترس نميتوان دادههاي بزرک را پردازش و كاربران را با مشكل مواجه كرد.
عليپور در ادامه به يكي از خصوصيتهاي اصلي داده بزرگ اشاره كرد و افزود: اغلب اوقات تصور بر اين است كه دادههاي بزرگ داراي ساختار و چارچوب مشخصي هستند، در صورتيكه گاهي ساخت نيافته بروز پيدا ميكنند. بهعنوان مثال در يك متن خود را نشان ميدهند و ما بايد از داخل متن دادهها را كشف كنيم.
وي عنوان كرد: دو محور اصلي براي كشف دادهها قابل بيان است؛ يكي از اين محورها توصيف و كشف دادهها و محور دوم پيشبينيپذيري از بين دادهها است. براي اينكه بتوان دادههاي بزرگ را در مباحث دانشگاهي يا فرادادهاي كه حجم قابل توجهي از دادهها را در بردارد تشخیص داد، بايد از اين دو محور استفاده كرد تا بتوان به چارچوب اصلي دادههاي بزرگ پي برد.
اين مدرس دانشگاه افزود: در كنار دو محور مذكور بايد تلخيص و بازنمايي دادهها را نيز در نظر بگيريم تا كار به مقصد نهايي نزديك شود.
استفاده شرکتهای بزرگ از فناوری وب برای دسترسی دادههای بزرگ
در بخش دیگری از اين نشست تخصصی، دكتر سيدمهدي طاهري، مدرس دانشگاه نیز اظهار كرد: از سال 1993 ميلادي كه دادههاي بزرگ تعميم پيدا كردند، اكثر شركتها و سازمانها ترغيب شدند كه دادههاي خود را با استفاده از فناوري وب قابل دسترس كنند و اين امر تنها با استفاده از فناوري داده بزرگ امكانپذير بود.
این کارشناس امور رایانه، با توضيح بيشتر پيرامون خاستگاه ايجاد دادههاي بزرگ و دادههاي پيوندي اظهار كرد: قابليتهاي موجود در دادههاي بزرگ به گونهاي است كه ميتوان از طريق آن كارهاي بسيار كلان را انجام داد و دادههاي خرد را در آمار قابل توجهي در يك زمان معين منتشر كرد.
طاهري با اشاره به ويژگي خاستگاه دادههاي بزرگ گفت: حجم انتشار، سرعت انتشار، تنوع انواع دادهها و اعتبار و وصول دادههاي منتشر شده از جمله ويژگيهايي است كه ميتوان از زمان بروز دادههاي بزرگ در سيستم رايانهاي مشاهده كرد.
به گفته وی حجم دادههاي بزرگ به مراتب و به مرور زمان بيشتر شدند و اين مساله با چالش مواجه شد و كارشناسان و متخصصان رايانه را برآن داشت تا آن را بازيابي و پردازش و بررسي كنند تا با يك مديريت تخصصي از چالش خارج كنند.
اهمیت جمعآوري، نگهداري و پردازش دادههاي بزرگ
دكتر محسن حاجی زينالعابديني، نیز در ادامه اين نشست علمی، با مثالي ساده از پيشرفت تلفنهاي همراه اظهار كرد: در گذشته تلفنهاي همراه صرفا دادهمحور بودند و با مرور زمان مولتي مديا به آن اضافه شد و بعد از آن مولتي مدياي پيشرفته و با كيفيت روي كار آمد و بعد از اضافه شدن دوربينهايي كه حجم و ظرفيت پردازنده بالا و چند هستهاي نياز داشتند، توليد شد.
وي افزود: جمعآوري، نگهداري و پردازش دادههاي بزرگ بسيار حايز اهميت است و كاربر از طريق روش صحيح اين فرايند ميتواند دادههاي بزرگ را به بهترين شكل استفاده كند بر اين اساس درباره دادههاي بزرگ ميتوان گفت از يك سو براي مخاطب موهبت هستند زيرا اطلاعات بزرگ را پردازش و قابل استفاده ميكنند و از سوي ديگر معضل هستند باعث ميشوند بازيابي دقيقي از اطلاعات نداشته باشيم.
زينالعابديني یادآور شد: بحث عمدهاي كه درباره دادههاي پيوندي وجود دارد اين است كه روزانه توسط افراد مختلف در وب توليد ميشوند و تغيير ميكنند كه اين دادهها هرچند نميتوانند قابل اطمينان باشند اما به دليل حجم بالايي كه دارند نياز به دادههاي بزرگ براي پردازش دارند.
بايد به دادههاي بزرگ بهعنوان فرصت نگاه کرد
در بخش دیگری از نشست، سید مهدی طاهري، با ايجاد اين سوال كه داده بزرگ فرصت است يا تهديد گفت: طي 4 سال قبل داده برگ يك چالش بود و زماني كه متخصصان بهطور جدي روي آن كار كردند به اين نتيجه رسيدم كه بايد به دادههاي بزرگ بهعنوان فرصت نگاه شود.
وي افزود: در اين دادهها ميتوان منابعي را تهيه كرد و با استناد به آنها درخواست مخاطب را در زمينه اطلاعاتي برآورده كرد همچنين يكي از كاربردهاي دادههاي بزرگ سيستمهاي پشتيباني هستند.
در ادامه عمراني از بعد فني به موضوع نشست نگاه كرد و افزود: اين بحث در عين فني بودن در مباحث ريزتر به نكات سياسي و اجتماعي توجه دارد و مخاطبان بايد با دقت و تمركز تمام اقدامات در روي دادهها را انجام دهند. به گونهاي كه تصور كنند اين روند مبارزه با دنيا است و به راحتي با جستجوي هر گونه مطلبي خود را به جهان معرفي نكنند.
این کارشناس کتابداری و اطلاعرسانی، به گزينههاي اطلاعاتي روز دنيا يعني ويكيپديا و آمازون اشاره كرد و گفت: اين سايتهاي اطلاعاتي هرچند از نگاه فني راهاندازي شدند اما افرادي در زيرمجموعه آن قرار دارند كه به دنبال ايجاد مباحث سياسي و اجتماعي هستند و اين نبايد از نگاه كاربران غافل بماند.
توجه به فضای ابری در زمینه امنیت اطلاعات
زينالعابديني در ادامه به مساله فضاي ابري اشاره كرد و گفت: فضاي ابري همان ابرهاي اطلاعاتي هستند كه ميتوانند در آن به امنيت اطلاعات شخصي اشاره كنند و اين امر از طريق دادههاي پيوندي امكانپذير ميشود به عبارت ديگر دادههاي پيوندي زيرمجموعه دادههاي بزرگ هستند زيرا به پردازش اطلاعات كمك ميكنند.
عمراني در واكنش به اين سخنان زينالعابديني گفت: در ابتدا از كتابخانهها براي پردازش اطلاعات استفاده ميشد اما به مرور زمان كامپيوترمنها روي كار آمدند و دادهها را تعريف كردند، اين در حالي است كه در بحث نرمافزارها دادههاي سامانيافته هر روز در حال تغيير است و هرچه هر كتابخانهاي براي به روز رساني آن پويا باشد، بازهم كافي نخواهد بود.
ایجاد دادههای پیوندی با هدف سرعتبخشی در انتقال اطلاعات
دکتر علیپور نیز در ادامه با تایید اظهارات عمرانی بیان کرد: دادههای پیوندی با هدف سرعتبخشی در انتقال اطلاعات ایجاد میشوند و برای مثال میتوان به ویکی پدیا اشاره کرد که با دادههای پیوندی، اطلاعات بسیاری را در اختیار افراد قرار میدهد.
طاهری نیز در تکمیل اظهارات علیپور، از دو خواستگاه اصلی از دادههای پیوندی یاد کرد و افزود: دو عامل هستیشناسانه و مفهومی و عامل ساختارمند کردن از مهمترین عواملی هستند که میتوان از طریق آن به دادههای پیوندی جامع و در نهایت به دادههای بزرگ رسید.
وی ادامه داد: پردازش دادهها زمانی رخ میدهد که بین آنها ارتباط برقرار شود که در این بین بافت مدیریت کتابخانهای عنوان میکند که زمانی اطلاعات داده میشوند که پردازش شوند.
طاهری گفت: هم اکنون شاهد هستیم بافتی که وجود دارد، درباره دادههای بزرگ بافت کتابخانهای است که الگوی آن در بافت کتابخانه ساخته شده و ارتباط را برقرار میکند.
کاربران امروزی هوشمند هستند
زینالعابدینی این بحث را ادامه داد و گفت: هم اکنون ما در کتابخانهها تغییر و تحولی هم در نوع و هم در کیفیت دادهها داشتیم که با یک بازیابی محتوایی ساده میتوان به جزئیات آن پی برد.
وی کاربران امروزی را کاربرانی هوشمند دانست و ادامه داد: هم اکنون جستجوی اطلاعات یک کتاب در کتابخانه امری پیش پا افتاده تلقی میشود و باید با توجه به ورود دادههای بزرگ و پیوندی، به تحلیل جدی و قدرتمند اطلاعات کتابهای موجود در کتابخانهها دست یافت.
کامپیوترمنها به عرصه جامعه آمدهاند
زینالعابدینی از سایر سخنرانان حاضر خواستار ارایه راهکاری برای بازیابی محتوایی به شیوه دادههای بزرگ و پیوندی شد که عمرانی با استناد به مثال ویکی پدیا و آمازون گفت: کتابخانهها باید به این باور که کامپیوترمنها به عرصه جامعه آمدهاند، برسند و در نهایت روزی برسد که بگوییم وب سمت سامان یافتن و بازیابی محتوایی رفته است و ابر اطلاعاتی بر تمام کتابخانهها پوشانده شدند. در حقیقت روزی میرسد که کاربر با مراجعه به یک مرجع کتابداری، میتوانند با پیوندهای مرتبط به تمام اطلاعات مورد نیاز دست یابد.
زین العابدینی هم با یادآور شدن این مطلب که تمام دنیا برای مشاهیر خود اطلاعات جامع و در دسترسی در وب آماده دارند، متخصصان و حتی افراد عادی جامعه را به سمت ایجاد فضای اطلاعاتی و ارطلاعرسانی برای مشاهیر کشورمان دعوت کرد.
وی همچنین از قرار گرفتن اطلاعات مشاهیر جمهوری اسلامی ایران در فهرست اطلاعاتی دنیا ابراز امیدواری کرد و افزود: امیدواریم روزی مرز اطلاعاتی در وب شکسته شود و نام مشاهیر خود را در فهرست مشاهیر دنیا ببینیم.
تهیه داده های بزرگ و مفید برای ایجاد ارتباط بین انسانها
علیپور حافظی، نیز با هدایت موضوع نشست به سمت معنادار شدن دادههای بزرگ و پیوندی، گفت: افراد با حجم اطلاعات وسیعی مواجه هستند که روشهای مختلفی برای پردازش آن وجود دارد. یکی از این روشها، تهیه دادههای بزرگ و مفید است.
وی افزود: برای اینکه روابط مفهومی و ارتباطی بین انسانها ایجاد شود نیاز به زمینهای از اطلاعات است که باید به مراتب تکمیل شود.
این مدرس دانشگاه همچنین یکی از روشهای موجود پیرامون بحث دادههای پیوندی را اینگونه توضیح داد که دادههای پیوندی باید مبتنی بر چارچوب معنایی مفهومی ایجاد شود و برای اینکه پیوند اطلاعاتی محقق شود باید شبکهای از مفاهیم را به این شکل در کنار هم قرار داده و مرتبط کنیم.
اطلاعات و دادههای ما باید شناسنامهدار شوند
زینالعابدینی در تکمیل اظهارات علیپور گفت: اطلاعات و دادهها برای مخاطب نیز باید دارای شناسنامه شوند تا بتوانیم در بین دادههای بزرگ جهانی دارای جایگاه شویم.
طاهری هم در سخنان پایانی خود گفت: در صورتیکه نگاه کنیم حرکت دادهها به چه سمتی میرود میتوانیم به گسترده شدن اطلاعات برسیم اما پیش از هر نکتهای باید به یکی بودن خواستگاه دادههای بزرگ و دادههای پیوندی پی ببریم.
زینالعابدینی نیز با بیان اینکه دادههای تفکیک شده امکان پردازش اطلاعات را بیشتر میکند، تاکید کرد: ما برای تولید دادههای بزرگ الگوهایی نیاز داریم که بومی شوند زیرا بسیاری از الگوهای موجود در وب، از فرهنگ و زبان فارسی و ایرانی فاصله دارد.
وی در پایان در نتیجهگیری این نشست گفت: کتابدارها هر چه دادهها را هدفمند تولید کنند، دادههای غنیتری خواهند داشت.
این کارشناس مساله دیگر را تغییر نوع رویکرد افراد به اطلاعات عنوان کرد و افزود: در گذشته این شیوه به این شکل بود که اطلاعات از طریق چاپگر به دست افراد میرسید اما امروز با پردازش سریع اطلاعات از طریق رایانه دیگر نیاز به چاپگر نبوده و حتی گاهی سیاستگذاری از طریق کاربران انجام میشود.
نظر شما