دانلود ترجمه مقاله ارزیابی اعتماد به داده های اینترنت اشیا (IoT) با یادگیری ماشین
عنوان فارسی |
ارزیابی اعتماد به داده های اینترنت اشیا (IoT) از طریق یادگیری ماشین |
عنوان انگلیسی |
On Evaluating IoT Data Trust via Machine Learning |
کلمات کلیدی : |
  سنتز داده ها؛ اعتماد به داده ها؛ داده حسگر اینترنت اشیا (IoT)؛ یادگیری ماشین؛ یادگیری نیمه نظارتی؛ داده های سری زمانی |
درسهای مرتبط | اینترنت اشیا |
تعداد صفحات مقاله انگلیسی : 17 | نشریه : MDPI |
سال انتشار : 2023 | تعداد رفرنس مقاله : 20 |
فرمت مقاله انگلیسی : PDF | نوع مقاله : ISI |
پاورپوینت : ندارد | وضعیت ترجمه مقاله : انجام نشده است. |
1. مقدمه 2. کارهای مرتبط 3. سنتز داده های دارای برچسب اعتماد 4. ویژگی ها 5. ارزیابی 6. بحث و بررسی 7. نتیجه گیری
چکیده – اعتماد به داده ها در اینترنت اشیاء برای حفظ حریم خصوصی، امنیت، تصمیم گیری قابل اعتماد، پذیرش کاربر و رعایت مقررات بسیار مهم است. اخیرا برای ارزیابی اعتماد به داده های اینترنت اشیاء، رویکردهای مختلفی مبتنی بر یادگیری ماشینی نظارت شده یا بدون نظارت (ML) پیشنهاد شده است. با این حال، ارزیابی اثربخشی آنها در دنیای واقعی عمدتاً به دلیل فقدان مجموعه داده های در دسترس عمومی مورد استفاده در معیارسنجی، دشوار است. از آنجایی که به دست آوردن چنین مجموعه های داده چالش برانگیز است، ما یک روش ترکیب داده به نام پرکردن تصادفی گام (RWI) را پیشنهاد می کنیم تا با ترکیب داده های غیرقابل اعتماد از داده های قابل اعتماد موجود، مجموعه های داده سری زمانی اینترنت اشیاء را تقویت کنیم. بنابراین، پرکردن تصادفی گام ما را قادر می سازد تا مجموعه داده های برچسب گذاری شده ای ایجاد کنیم که می توان از آنها برای توسعه و اعتبارسنجی مدل های ML و ارزیابی اعتماد داده های اینترنت اشیاء استفاده کرد. همچنین ویژگی های جدیدی را از داده های حسگر سری زمانی اینترنت اشیاء استخراج می کنیم که به طور موثر همبستگی خودکار و همچنین همبستگی متقابل آن را توسط داده های حسگرهای همسایه (همتا) نشان می دهد. می توان از این ویژگی ها برای یادگیری مدل های ML و تشخیص قابل اعتماد بودن داده های حسگر اینترنت اشیاء استفاده کرد. به کمک مجموعه داده های ترکیب شده با برچسب حقیقت مبنا و ویژگی های مبتنی بر همبستگی آموزنده و از طریق ML، آزمایش های گسترده ای را برای بررسی رویکردهای مختلف و ارزیابی اعتماد به داده های اینترنت اشیاء انجام می دهیم. نتایج نشان می دهد که رویکردهای رایج مبتنی بر ML برای ارزیابی اعتماد داده های اینترنت اشیاء، که به تجزیه و تحلیل خوشه ای بدون نظارت و تخصیص برچسب های اعتماد به داده های بدون برچسب متکی هستند، دارای عملکرد ضعیفی هستند. این عملکرد ضعیف به دلیل وجود این فرضیه اساسی بوجود آمد که خوشه بندی، برچسب های قابل اعتمادی را برای اعتماد داده ها فراهم می کند و غیرقابل دفاع می باشد. همچنین نتایج نشان می دهد زمانی که مدل های ML بر روی مجموعه داده های تقویت شده از طریق RWI و با استفاده از ویژگی های پیشنهادی آموزش داده می شوند، به خوبی به داده های دیده نشده تعمیم می یابند و از رویکردهای مرتبط موجود پیشی می گیرند. علاوه بر این، مشاهده می کنیم که یک رویکرد ML نیمه نظارت شده که تنها به حدود 10٪ از داده های برچسب گذاری شده نیاز دارد، عملکرد رقابتی را ارائه می دهد، در حالی که در مقایسه با رویکردهای کاملاً نظارت شده عملاً جذاب تر است. کد و داده های پایتون به صورت آنلاین در دسترس قرار دارند.
ترجمه مقاله مرتبط با این مقاله | دانلود ترجمه مقاله یادگیری ماشین برای تحلیل داده های اینترنت اشیا |
Data trust in IoT is crucial for safeguarding privacy, security, reliable decision-making, user acceptance, and complying with regulations. Various approaches based on supervised or unsupervised machine learning (ML) have recently been proposed for evaluating IoT data trust. However, assessing their real-world efficacy is hard mainly due to the lack of related publicly available datasets that can be used for benchmarking. Since obtaining such datasets is challenging, we propose a data synthesis method, called random walk infilling (RWI), to augment IoT time-series datasets by synthesizing untrustworthy data from existing trustworthy data. Thus, RWI enables us to create labeled datasets that can be used to develop and validate ML models for IoT data trust evaluation. We also extract new features from IoT time-series sensor data that effectively capture its autocorrelation as well as its cross-correlation with the data of the neighboring (peer) sensors. These features can be used to learn ML models for recognizing the trustworthiness of IoT sensor data. Equipped with our synthesized ground-truth-labeled datasets and informative correlation-based features, we conduct extensive experiments to critically examine various approaches to evaluating IoT data trust via ML. The results reveal that commonly used ML-based approaches to IoT data trust evaluation, which rely on unsupervised cluster analysis to assign trust labels to unlabeled data, perform poorly. This poor performance is due to the underlying assumption that clustering provides reliable labels for data trust, which is found to be untenable. The results also indicate that ML models, when trained on datasets augmented via RWI and using the proposed features, generalize well to unseen data and surpass existing related approaches. Moreover, we observe that a semi-supervised ML approach that requires only about 10% of the data labeled offers competitive performance while being practically more appealing compared to the fully supervised approaches. The related Python code and data are available online.
نقد و بررسیها
هنوز بررسیای ثبت نشده است.