دانلود ترجمه مقاله شناسایی خطای نرم افزاری و بازیابی در سیستم های زمان واقعی بحرانی
عنوان فارسی |
شناسایی خطای نرم افزاری و بازیابی در سیستم های زمان واقعی بحرانی: یک روش مبتنی بر اتصال آزاد |
عنوان انگلیسی |
Software fault detection and recovery in critical real-time systems: An approach based on loose coupling |
کلمات کلیدی : |
  دستگاه ITER؛ بررسی از راه دور؛ نرم افزار؛ تلورانس خطا؛ قابلیت اطمینان؛ زمان واقعی |
درسهای مرتبط | اتوماسیون و هیدرولیک های هوشمند |
تعداد صفحات مقاله انگلیسی : 6 | نشریه : ELSEVIER |
سال انتشار : 2014 | تعداد رفرنس مقاله : 14 |
فرمت مقاله انگلیسی : PDF | نوع مقاله : ISI |
پاورپوینت :
ندارد سفارش پاورپوینت این مقاله |
وضعیت ترجمه مقاله : انجام شده و با خرید بسته می توانید فایل ترجمه را دانلود کنید |
1. مقدمه 2. پیشینه 3. شناسایی خطا و بازیابی در سیستم های زمان واقعی 3.1. تعریف سیستم 3.2. ساختار 3.3. مدیر سرویس و پیکربندی سرویس 3.4. طراحی سرویس 4. سیستم کنترل و جابه جایی از راه دور 5. بازیابی خطا برای سیستم RH 5.1. انواع خطا 5.2. بازیابی خرابی سرویس 5.3. آنالیز زمان بندی فرایند بازیابی 5.4. هزینه های عملکرد 6. نتیجه گیری
پیشینه: تلورانس خطا به معنی اجتناب از ایجاد اختلال در صورت وجود خطاست و شامل برنامه های شناسایی و بازیابی خطا می باشد. هرچند، بازیابی می تواند تاخیرهای غیر قابل پیشبینی را به وجود بیاورد که ممکن است با پیش نیازهای قابلیت اطمینان سیستم های زمان واقعی مغایرت داشته باشد. در یکی از نمونه های تلرانس خطای زمان واقعی از دو یا چند ورژن مختلف نرم افزاری استفاده می شود. چنین روشی معمولا برای هوانوردی مورد استفاده قرار می گیرد جاییکه حیطه سیستم های بحرانی محدود است و هزینه ایجاد نرم افزار چند ورژنی در میان چندین هواپیما توزیع می شود. برای سیستم های نرم افزاری فعال/ غیرفعال پیچیده و بزرگ مانند RH، بررسی تکنیک های چند ورژنی به سختی صورت می گیرد. چالش های کلیدی که محققان برای تلرانس خطا در سیستم های RH با آن روبرو می شوند، عبارتند از: بازیابی داده های حالت، شناسایی معتبر خطا، بازیابی خطایی که از پیش نیازهای زمان واقعی حمایت می نماید و قابلیت اطمینان زنجیره های خدمت به هم پیوسته. فرایند ایمنی سیستم بیشتر بر روی نتایج خطا تمرکز می نماید که به واسطه داشتن ماهیت پیچیده و تصادفی برای CPS به عنوان یک سطح تحقیقاتی باز مهم در نظر گرفته می شود. درتحقیقات قبلی مربوط به تلرانس خطای زمان واقعی بر روی راه حل های مبتنی بر افزونگی و پیکربندی مجدد تمرکز می شد. گونزالس و همکارانش در تحقیقات خود از مدیریت افزونگی تطبیقی برای قابلیت اطمینان مدول های بحرانی استفاده کردند، در این فرایند مقدار زیادی افزونگی برای مدول های بحرانی اندک اختصاص داده می شود. بنابراین، پیش نیازهای منبع آنها به شکل جالبی کاهش خواهد یافت. روش پیکربندی مجدد مربوط به خرابی دستگاه در منبع (6) توضیح داده شده است. این فرایند باعث ایجاد خطا در تابع اولیه می شود، سپس بعضی از تابع های ساده تر مجددا پیکربندی خواهند شد. پیکربندی مجدد سیستم به عنوان یک بخش بحرانی در نظر گرفته می شود، درنتیجه؛ به شکل رسمی مورد بررسی قرار می گیرد. محققی به نام شا در تحقیقات خود از یک معماری ساده در زیرسیستم های کنترل عملکرد، بیمه و ضریب اطمینان بالا استفاده کرد. معماری ORTEGA باعث بهبود ساختارهای ساده از طریق شناسایی تقاضای آنلاین و بازیابی خطا می شود. زیرسیستم با ضریب اطمینان بالا برای حفظ سیستم در یک پوش ایمنی به کار می رود. علاوه برآن، از روش نابهنجار برای شناسایی خطاهای نرم افزار و سخت افزاری در سیستم های محاسبه کننده نافذ یا فراگیرنده استفاده می شود که در منبع (9) قابل مشاهده است. در این متدلوژی معمولا مجموعه ای از ویژگی ها برای بررسی تغییرپذیری زمانی و فضایی به کار می رود، برای تحقق این هدف، موتور آنالیز نابهنجار نقش عمده ای را ایفا می نماید. تنها تفاوتی که در تحقیقات ما مشاهده می شود، آن است که بیشتر بر روی خطاهای گذرا در سیستم زمان واقعی با استفاده از روش مدولی به جای افزونگی تمرکز می گردد. یک راه حل مشابه مبتنی بر مدولاسیون و ایزوله سازی خطا با موفقیت استفاده شده است، برای مثال، در سیستم عامل MINIX زمان غیر واقعی (OS) برای مدیریت درایور به کار می رود [10].
Background: Fault tolerance means avoiding service failures in the presence of faults, and consists of error detection and recovery [3]. However, recovery can introduce unpredictable delays that might be in conflict with the predictability requirements of real-time systems. Atypical approach for real-time fault tolerance is to use two or more diverse versions of software. Such an approach is suitable, e.g. in aviation, where the scope of critical systems is limited, and the cost of creating multi-version software is distributed over a large number of aircraft [4]. However, for large and complex one-off software systems, such as RH, use of multi-version techniques is difficult to justify. Key challenges for fault tolerance in RH systems include recovery of state data, reliable detection of faults, fault recovery that supports real-time requirements, and ensuring reliability of end-to-end service chains. Safety of the system relies heavily on reasoning about consequences of faults, which is an important open research area due to the complex and stochastic nature characteristic for CPS. Previous research on real-time fault tolerance has focused largely on redundancy-based solutions and reconfiguration. Gonzales et al. use adaptive management of redundancy to assure reliability of critical modules by allocating as much redundancy to less critical modules as could be afforded, thus gracefully reducing their resource requirements [5]. Assured reconfiguration in case of failures is used in [6]. This allows the primary function to fail and then reconfigure to some simpler function – reconfiguration of the system is a critical part, and it is formally verified. Simplex architecture by Sha et al. uses high assurance and high performance control subsystems [7]. The high assurance subsystem is used to keep the system within the safety envelope. ORTEGA architecture improves the Simplex architecture by adding on-demand detection and recovery of faulty tasks [8]. An anomaly based approach for detecting and identifying software and hardware faults in pervasive computing systems is proposed in [9]. The methodology uses an array of features to capture spatial and temporal variability to be used by an anomaly analysis engine. Our work differs from these approaches by focusing on transient faults in a real-time system by using highly modular approach instead of redundancy. Similar solution based on modularity and fault isolation has been successfully used, e.g. in the non-real-time MINIX operating system (OS) for driver management [10].
بخشی از ترجمه مقاله (صفحه 14 فایل ورد ترجمه)
محتوی بسته دانلودی:
PDF مقاله انگلیسی ورد (WORD) ترجمه مقاله به صورت کاملا مرتب (ترجمه شکل ها و جداول به صورت کاملا مرتب)
دیدگاهها
هیچ دیدگاهی برای این محصول نوشته نشده است.