تأثیر احتمالی انفجار مداوم داده ها در سراسر جهان همچنان تخیل را برانگیخته است. طبق گزارش سال 2018 ، هر ثانیه از هر روز ، هر فرد به طور متوسط 1.7 مگابایت داده تولید می کند – و ایجاد داده های سالانه از آن زمان بیش از دو برابر شده و پیش بینی می شود که تا سال 2025 دوباره بیش از دو برابر شود. استفاده ماهرانه از داده های بزرگ می تواند 3 تریلیون دلار دیگر در فعالیت های اقتصادی ایجاد کند و برنامه های متنوع مانند اتومبیل های خودران ، مراقبت های بهداشتی شخصی و زنجیره های تأمین مواد غذایی قابل ردیابی را قادر می سازد.
اما افزودن همه این داده ها به سیستم باعث ایجاد ابهام در نحوه یافتن ، استفاده از آن ، مدیریت آن و به اشتراک گذاری قانونی ، ایمن و کارآمد می شود. یک مجموعه داده خاص از کجا آمده است؟ چه کسی مالک چه چیزی است؟ چه کسی اجازه دارد موارد خاصی را ببیند؟ کجا ساکن است؟ آیا می توان آن را به اشتراک گذاشت؟ آیا قابل فروش است؟ آیا مردم می توانند نحوه استفاده از آن را ببینند؟
با افزایش و فراگیر شدن برنامه های کاربردی داده ها ، تولیدکنندگان ، مصرف کنندگان و صاحبان و سرپرستان داده ها متوجه می شوند که دفترچه ای برای پیگیری ندارند. مصرف کنندگان می خواهند به داده های مورد اعتماد خود متصل شوند تا بتوانند بهترین تصمیمات ممکن را بگیرند. تولیدکنندگان به ابزارهایی نیاز دارند تا داده های خود را با خیال راحت با کسانی که به آن نیاز دارند به اشتراک بگذارند. اما پلتفرم های فناوری کوتاه می آیند و هیچ منبع واقعی واقعی برای اتصال هر دو طرف وجود ندارد.
چگونه داده ها را پیدا کنیم؟ چه زمانی باید آن را جابجا کنیم؟
در یک دنیای کامل ، داده ها آزادانه مانند ابزاری برای همه در دسترس هستند. می توان آن را بسته بندی کرد و مانند مواد اولیه به فروش رساند. هر کسی که مجاز به دیدن آن باشد ، می تواند به راحتی و بدون عوارض مشاهده شود. ریشه ها و حرکات آن قابل ردیابی است و هر گونه نگرانی در مورد استفاده های بد را در جایی در خط برطرف می کند.
البته دنیای امروز به این شکل عمل نمی کند. انفجار عظیم داده ها لیست طولانی از مسائل و فرصت ها را ایجاد کرده است که به اشتراک گذاری تکه های اطلاعات را مشکل می کند.
با ایجاد داده ها تقریباً در همه جا در داخل و خارج از یک سازمان ، اولین چالش شناسایی آنچه جمع آوری می شود و نحوه سازماندهی آن تا بتوان آن را پیدا کرد.
عدم وجود شفافیت و حاکمیت بر داده ها و زیرساخت های ذخیره شده و پردازش شده ، مسائل مربوط به اعتماد را باز می کند. امروزه انتقال داده ها به مکان های متمرکز از چندین پشته فناوری گران و ناکارآمد است. فقدان استانداردهای فراداده باز و رابط های برنامه نویسی برنامه های کاربردی در دسترس ، دسترسی و مصرف داده ها را دشوار می کند. وجود هستی شناسی داده های مربوط به بخش می تواند استفاده از منابع جدید داده را برای افراد خارج از بخش دشوار کند. ذینفعان متعدد و مشکل در دسترسی به خدمات داده موجود می تواند به اشتراک گذاری بدون مدل حاکمیت را دشوار کند.
اروپا پیشرو است
با وجود مشکلات ، پروژه های به اشتراک گذاری داده ها در مقیاس بزرگ در حال انجام است. یکی با حمایت اتحادیه اروپا و یک گروه غیرانتفاعی در حال ایجاد مبادله داده های قابل همکاری به نام Gaia-X است که در آن مشاغل می توانند داده ها را تحت حمایت قوانین سختگیرانه اروپایی در مورد حریم خصوصی داده ها به اشتراک بگذارند. مبادله به عنوان سفارشی برای به اشتراک گذاری داده ها در صنایع و مخزنی برای اطلاعات در مورد خدمات داده در اطراف هوش مصنوعی (AI) ، تجزیه و تحلیل و اینترنت اشیا در نظر گرفته شده است.
Hewlett Packard Enterprise اخیراً یک چارچوب راه حل برای حمایت از شرکت ها ، ارائه دهندگان خدمات و مشارکت سازمان های عمومی در Gaia-X اعلام کرد. پلت فرم فضاهای داده ، که در حال حاضر در حال توسعه است و بر اساس استانداردهای باز و بومی ابری است ، دسترسی به داده ها ، تجزیه و تحلیل داده ها و AI را با دسترسی بیشتر به متخصصان دامنه و کاربران عادی دموکراتیک می کند. این مکانی را فراهم می کند که متخصصان مناطق دامنه می توانند به راحتی مجموعه های داده قابل اعتماد را شناسایی کرده و با خیال راحت تجزیه و تحلیل داده های عملیاتی را انجام دهند – بدون این که همیشه نیاز به جابجایی پرهزینه داده ها به مکان های متمرکز داشته باشید.
با استفاده از این چارچوب برای ادغام منابع داده پیچیده در چشم اندازهای فناوری اطلاعات ، شرکت ها قادر خواهند بود شفافیت داده ها را در مقیاس وسیع ارائه دهند ، بنابراین همه – اعم از دانشمند داده یا نه – می دانند چه داده هایی دارند ، چگونه به آنها دسترسی دارند و چگونه از آنها استفاده کنند. در زمان واقعی.
ابتکارات به اشتراک گذاری داده ها نیز در رأس برنامه های شرکت ها قرار دارد. یکی از اولویت های مهم شرکت ها ، بررسی داده هایی است که برای آموزش مدل های هوش مصنوعی داخلی و یادگیری ماشین استفاده می شود. هوش مصنوعی و یادگیری ماشینی در حال حاضر به طور گسترده ای در شرکت ها و صنایع مورد استفاده قرار می گیرد تا پیشرفت های مداوم در همه چیز را از توسعه محصول گرفته تا جذب نیرو گرفته تا تولید ، ایجاد کند. و ما تازه شروع به کار می کنیم. IDC پیش بینی می کند بازار جهانی هوش مصنوعی از 328 میلیارد دلار در سال 2021 به 554 میلیارد دلار در سال 2025 برسد.
برای آشکارسازی پتانسیل واقعی هوش مصنوعی ، دولت ها و شرکت ها باید میراث جمعی همه داده هایی که این مدل ها را هدایت می کنند بهتر درک کنند. مدلهای هوش مصنوعی چگونه تصمیمات خود را می گیرند؟ آیا آنها تعصب دارند؟ آیا آنها قابل اعتماد هستند؟ آیا افراد غیرقابل اعتماد توانسته اند به داده هایی که یک شرکت مدل خود را در برابر آنها آموزش داده است دسترسی داشته باشند یا آنها را تغییر دهند؟ اتصال شفاف تر و کارآمدتر تولیدکنندگان داده به مصرف کنندگان داده می تواند به پاسخ به برخی از این سوالات کمک کند.
ایجاد بلوغ داده ها
شرکت ها نمی خواهند نحوه باز کردن قفل همه داده های خود را یک شبه حل کنند. اما آنها می توانند خود را برای استفاده از فناوری ها و مفاهیم مدیریتی که به ایجاد ذهنیت اشتراک داده کمک می کند ، آماده کنند. آنها می توانند اطمینان حاصل کنند که در حال توسعه بلوغ برای مصرف یا به اشتراک گذاری داده ها به صورت استراتژیک و م effectivelyثر هستند تا اینکه آن را به صورت موقت انجام دهند.
تولیدکنندگان داده می توانند با انجام یک سری مراحل برای توزیع گسترده تر داده ها آماده شوند. آنها باید درک کنند که داده های آنها کجاست و نحوه جمع آوری آنها را درک کنند. سپس ، آنها باید اطمینان حاصل کنند که افرادی که داده ها را مصرف می کنند ، توانایی دسترسی به مجموعه داده های مناسب در زمان مناسب را دارند. این نقطه شروع است.
سپس قسمت سخت تر می آید. اگر تولیدکننده داده دارای مصرف کننده باشد – که می تواند در داخل یا خارج از سازمان باشد – باید به داده ها متصل شود. این هم یک چالش سازمانی و هم یک فناوری است. بسیاری از سازمانها خواهان حاکمیت بر اشتراک داده ها با سایر سازمانها هستند. دموکراتیزاسیون داده ها – حداقل قادر به یافتن آن در سازمان ها – یک مسئله بلوغ سازمانی است. چگونه با آن برخورد می کنند؟
شرکت هایی که به صنعت خودرو کمک می کنند ، داده ها را به طور فعال با فروشندگان ، شرکا و پیمانکاران فرعی به اشتراک می گذارند. برای مونتاژ اتومبیل به قسمت های زیادی نیاز است – و هماهنگی زیادی -. شرکا به آسانی اطلاعاتی را در مورد همه چیز از موتورها تا لاستیک ها تا کانال های تعمیر وب فعال می کنند. فضاهای داده خودرو می تواند به بیش از 10،000 فروشنده خدمات ارائه دهد. اما در صنایع دیگر ، ممکن است جزیره ای تر باشد. برخی از شرکت های بزرگ ممکن است مایل به اشتراک گذاری اطلاعات حساس حتی در شبکه خود از واحدهای تجاری نباشند.
ایجاد ذهنیت داده
شرکت های طرفین تولیدکننده مصرف کننده-تولیدکننده می توانند ذهن خود را در زمینه به اشتراک گذاری داده ها با طرح این سوالات استراتژیک پیش ببرند:
- اگر شرکت ها در حال ایجاد راه حل های هوش مصنوعی و یادگیری ماشین هستند ، تیم ها از کجا اطلاعات خود را دریافت می کنند؟ چگونه آنها به آن داده ها متصل می شوند؟ و چگونه آنها این سابقه را برای اطمینان از قابلیت اطمینان و منشاء داده ها دنبال می کنند؟
- اگر داده ها برای دیگران ارزش داشته باشد ، راه کسب درآمد امروز تیم برای گسترش این ارزش چگونه است و چگونه بر آن نظارت می شود؟
- اگر شرکتی در حال مبادله یا کسب درآمد از داده ها است ، آیا می تواند مجموعه وسیع تری از خدمات را در چندین سیستم عامل – در محل و در فضای ابری مجاز کند؟
- برای سازمان هایی که نیاز به اشتراک گذاری داده ها با فروشندگان دارند ، چگونه هماهنگی این فروشندگان با مجموعه داده ها و به روز رسانی های مشابه امروز انجام می شود؟
- آیا تولیدکنندگان می خواهند داده های خود را تکرار کنند یا افراد را مجبور به آوردن مدل برای خود کنند؟ مجموعه داده ها ممکن است آنقدر بزرگ باشند که قابل تکرار نباشند. آیا یک شرکت باید توسعه دهندگان نرم افزار را در بستر خود در جایی که داده های آن وجود دارد ، میزبانی کند و مدل ها را به داخل و خارج منتقل کند؟
- چگونه کارکنان یک بخش که داده مصرف می کند می تواند بر عملکرد تولیدکنندگان داده بالادستی در سازمان خود تأثیر بگذارد؟
اقدام کردن
انقلاب داده ها فرصت های تجاری ایجاد می کند – همراه با سردرگمی فراوان در مورد نحوه جستجو ، جمع آوری ، مدیریت و کسب اطلاعات بصورت استراتژیک از آن داده ها. ارتباط بین تولیدکنندگان و مصرف کنندگان داده ها بیشتر می شود. HPE در حال ایجاد پلتفرمی است که از فضای داخلی و عمومی پشتیبانی می کند ، با استفاده از منبع باز به عنوان پایه و راه حل هایی مانند HPE Ezmeral Software Platform زمینه مشترکی را فراهم می کند که هر دو طرف باید انقلاب داده را برای آنها کار کنند.
مقاله اصلی را در Enterprise.nxt بخوانید.
این محتوا توسط Hewlett Packard Enterprise تولید شده است. این توسط تحریریه MIT Technology Review نوشته نشده است.