دانلود ترجمه مقاله بررسی انتقادی استراتژی های تکرار شوندگی شبکه داده بر اساس روش های داده کاوی
عنوان فارسی |
بررسی انتقادی استراتژی های تکرار شوندگی شبکه داده بر اساس روش های داده کاوی |
عنوان انگلیسی |
A critical survey of data grid replication strategies based on data mining techniques |
کلمات کلیدی : |
  شبکه داده؛ استراتژی تکرار؛ همبستگی فایل ها؛ داده کاوی؛ استخراج دیتای شبکه؛ راهبرد |
درسهای مرتبط | مدیریت بازاریابی |
تعداد صفحات مقاله انگلیسی : 10 | نشریه : ELSEVIER |
سال انتشار : 2015 | تعداد رفرنس مقاله : 31 |
فرمت مقاله انگلیسی : PDF | نوع مقاله : ISI |
پاورپوینت :
ندارد سفارش پاورپوینت این مقاله |
وضعیت ترجمه مقاله : انجام شده و با خرید بسته می توانید فایل ترجمه را دانلود کنید |
1. مقدمه و انگیزه ها 2. استراتژی های تکرار بر مبنای تکنیک های داده کاوی 3. آنالیز و بحث 4. راهبردی برای داده کاوی بر مبنای استراتژی های تکرار 5. نتیجه گیری و پژوهش های آتی
ما در این مقاله یک برآورد بحرانی از استراتژی های تکرار مبتنی بر داده کاوی اختصاصی برای شبکه های داده را ارائه نموده ایم. هدف اصلی این اثر در مطالعه شیوه ای است که تکنیک های داده کاوی می توانند برای دستیابی داده های تاریخی شبکه های داده بکار روند و اینکه آنها چطور دانش همبستگی های فایل را استنباط نموده و از آنها برای ارتقاء عملکرد استراتژی های تکرار استفاده می کنند. دو هم بخشی در این مقاله صورت گرفته است: از یک سو، یک براورد بحرانی از استراتژی های تکرار اصلی بر مبنای تکنیک های داده کاوی و از سوی دیگر، یک راهبرد جدید برای کاربرد داده کاوی در بستر استراتژی های تکرار شبکه داده. ما پیشنهاد می کنیم این راهبرد آثار تحقیقاتی بیشتری را در این حوزه نوید بخش تسهیل خواهد کرد و اشاره هایی را به آثار دیگری دارد که باید در حوزه داده کاوی و تکرار شبکه داده صورت گیرد. از این براورد، میتوان دید تعداد استراتژی های تکرار ارائه شده بر مبنای تکنیک های داده کاوی محدود می شود و بنابراین کارهای زیادی وجود دارند که باید در حوزه تکرار داده بر روی داده کاوی صورت پذیرند. برخی آثار تحقیقاتی آینده در زیر مورد بحث قرار میگیرند. ما می توانیم متذکر شویم کل روشهای موجود برای کاوش همبستگی های فایل یا بر روی دنباله دستیابی فایل یا صفات فایل تکیه دارند. ما پیشنهاد میکنیم همبستگی های فایل پیچیده تر با ترکیب خردمندانه تر استخراج دنباله دستیابی با استخراج صفت فایل میتواند استنباط شود. برای پروپوزالهای آینده بسیار جالب است که به سوی این دستور العمل سوق یابند. دستورالعمل آینده اصلی دیگری که ما ارائه میدهیم استفاده از تکنیک های نمودار داده کاوی در شبکه داده برای بررسی خوشه های مکان شبکه است، یعنی گروه های مکانها (پروفایلهای کاربران) یا خوشه هایی که دارای گرایشات مشترک روی فایلهای شبکه هستند. در واقع، چنین تکنیک هایی بری حل مشکلات بسیار کارامد اثبات شده اند که میتوانند با استفاده از نمودارهایی مانند موارد مربوط به شبکه های اجتماعی و غیره، مدلسازی شوند. در این زمینه، مکانهای شبکه داده میتواند به صورت ندهای یک نمودار قلمداد شوند در حالیکه بین مکانها را به صورت لبه ها متصل میکند. از یک نقطه نظر آزمایشی، گرچه همبستگی های فایل یک الگوی مشترک مشاهده شده در سیستم های شبکه حقیقی است، مانند همکاری فیزیکی با انرژی بالا و انواع ابزارهایی وجود دارد که این سیستم های شبکه را نظارت میکنند، اما کل استراتژی ها از شبکه سازی برای ارزیابی و محک زدن الگوریتمهای تکرار استفاده میکنند. از اینرو، این بسیار جالب خواهد بود زیرا یک مرحله بعدی برای محک زدن استراتژی ها در یک محیط شبکه حقیقی است. به علاوه، مشاهده شده است بیشتر استراتژی ها نتایج را با نتایج بسیار پایه ای مقایسه میکنند. از اینرو، آزمایشات زیادی هم چنان برای ارزیابی کامل عملکردهای آنها لازم است. این مساله در اثر آینده ما شامل شده است. در واقع، ما در این زمینه برای انجام یک مطالعه کمّی از این استراتژی ها، از طریق بکار گیری مجدد آنها برنامه ریزی میکنیم. این کار اجازه ایجاد یک پایگاه دستیابی آزاد را برای اجراهای استراتژی های تکرار فراهم می سازد که میتواند از طریق محققانی توسعه یابد که قصد دارند اجراهای خود را براحتی برای کاربران علاقمند، در دسترس قرار دهند. در همین زمینه، بیشتر استراتژی های مورد بحث در این مقاله، اثر پارامترهای بررسی شده مختلف را بر روی نتایج ارزیابی عملکرد مطالعه نمیکند. در واقع، پارامترهایی مانند دوره یا به بیان دیگر طول تاریخچه (روزنه های تاریخی کوچک یا طولانی) و آستانه هایی برای استنباط همبستگی معتبر، بسیار مهم هستند و دارای اثر بسزایی بر نتایج کسب شده هستند. به علاوه، چون اجرای استراتژی تکرار بر مبنای تکنیک داده کاوی است، هم چنین به زمان اجرای الگوریتم داده کاوی بستگی دارد، مخارج کلی داده کاوی بر روی عملکردهای استراتژی باید ارزیابی شوند.
We have presented in this paper a critical survey of data mining-based replication strategies dedicated to data grids. The main objective of this work consists in the study of how the data mining techniques can be applied to access historical data of data grids and how do they infer file correlations knowledge and use them to enhance replication strategies performance. Two contributions are made in this article: on the one hand, a critical survey of the main replication strategies based on data mining techniques and, on the other hand, a new guideline to data mining application in the context of data grid replication strategies. We suggest that this guideline would facilitate further research works in this promising area and to give hints to other works to be done in the area of data mining and data grid replication. From this survey, it can be seen that the number of the proposed replication strategies based on data mining techniques is limited and so there is still a lot of work to be done in the field of data replication based on data mining. Some future research works are discussed below. We can note that all of the existing methods for mining file correlations either rely on file access sequence or file attributes. We suggest that more complex file correlations by judiciously combining access sequence mining with semantic file attribute mining can be inferred. It will be very interesting to future proposals to be oriented towards this direction. Another original future direction that we propose is to use data mining graph techniques in data grid to explore grid site clusters, i.e., groups of sites (profiles of users) or clusters that have common interests on grid files. Indeed, such techniques have been proved to be very efficient for resolving problems that can be modeled using graphs like those related to social networks, etc. In this respect, the data grid sites can be considered as nodes of a graph while links between sites as edges. From an experimental point of view, although file correlations are a common patterns observed in real data grid systems [22], like high-energy physics collaboration, and that there are a variety of tools that enable monitoring these grid systems, all strategies use simulation to evaluate and test the replication algorithms. Hence, it would be very interesting as a next step to test their strategies in a real grid environment. In addition, it has been observed that most of strategies compare the results with the very basic ones. Hence a lot of experiments are still required for thoroughly assessing their performances. This issue is included in our future work. Indeed, we plan in this respect to perform a quantitative study of these strategies through re-implementing them. This will allow setting an open access platform for replication strategies implementations that can be extended through researchers aiming at making their implementations easily available for interested users. In this same context, the most of the strategies discussed in this paper do not study the impact of different considered parameters on performance evaluation results. Indeed, parameters such as period or in other words the history length (a small history windows or a long one) and thresholds for valid correlation inferring are very important and have a great impact on the obtained results. Furthermore, since the execution of replication strategy based on data mining technique depends also on the execution time of data mining algorithm, data mining overhead on strategy performances must be assessed.
محتوی بسته دانلودی:
PDF مقاله انگلیسی ورد (WORD) ترجمه مقاله به صورت کاملا مرتب
دیدگاهها
هیچ دیدگاهی برای این محصول نوشته نشده است.