سپیده کیانی نژاد
نام مترجم |
سپیده کیانی نژاد |
Early detection of cancer is the most promising way to enhance a patient’s chance for survival. This paper presents a computer aided classification method in computed tomography (CT) images of lungs developed using artificial neural network. The entire lung is segmented from the CT images and the parameters are calculated from the segmented image. The statistical parameters like mean, standard deviation, skewness, kurtosis, fifth central moment and sixth central moment are used for classification. The classification process is done by feed forward and feed forward back propagation neural networks. Compared to feed forward networks the feed forward back propagation network gives better classification. The parameter skewness gives the maximum classification accuracy. Among the already available thirteen training functions of back propagation neural network, the Traingdx function gives the maximum classification accuracy of 91.1%. Two new training functions are proposed in this paper. The results show that the proposed training function 1 gives an accuracy of 93.3%, specificity of 100% and sensitivity of 91.4% and a mean square error of 0.998. The proposed training function 2 gives a classification accuracy of 93.3% and minimum mean square error of 0.0942.
تشخیص زودهنگام سرطان، امیدوارکننده ترین راه برای افزایش شانس زنده ماندن بیمار است. در این مقاله با استفاده از شبکه های عصبی مصنوعی، روشی برای طبقه بندی تصاویر توموگرفی رایانه ای (تصاویر CT) ریه، ارائه شده است. براساس تصاویر CT، کل ریه قطعه بندی شده است و پارامترها از روی تصاویر قطعه بندی شده محاسبه می شوند. پارامترهای آماری همچون میانگین، انحراف معیار، چولگی، کشیدگی، گشتاور مرکزی مرتبه پنجم و گشتاور مرکزی مرتبه ششم، پارامترهایی هستند که در طبقه بندی مورد استفاده قرار می گیرند. فرایند طبقه بندی، با استفاده از شبکه های عصبی پیشخور و شبکه های عصبی انتشار به عقب انجام می شود. شبکه های عصبی پیشخورِ انتشار به عقب، در مقایسه با شبکه های عصبی رو به جلو، نتایج بهتری را برای طبقه بندی ارائه می دهند. پارامتر چولگی حداکثر دقت طبقه بندی را ارائه می دهد. در میان سیزده تابع آموزشی موجود برای آموزش شبکه های عصبی انتشار به عقب، تابع آموزشیِ Traingdx بالاترین دقت طبقه بندی را ارائه می دهد؛ یعنی 91.1%. در این مقاله، دو تابع آموزشی جدید نیز ارائه شده است. نتایج نشان می دهد که اولین تابع آموزشی پیشنهادی به دقتِ 93.3%، تشخیصِ 100%، حساسیتِ 91.4% و حداقل میانگین مربعات خطای 0.998 دست یافته است. دومین تابع آموزشی پیشنهادی نیز به دقتِ 93.3% و حداقل میانگین مربعات خطای 0.0942 دست یافته است.
The challenges of data management and analytics in the intelligent economy are likely to overwhelm organizations that are not conversant with Big Data technologies. IDC's year-long study of the uses and market for Big Data technology has demonstrated that each use case requires different combinations of software, hardware, and services to be most effective. The widespread adoption of Big Data technologies outside of high-performance computing (HPC) has only begun, but emerging trends suggest the development of a fast-growing market that is expected to accelerate rapidly.
به احتمال زیاد در اقتصاد هوشمند، چالش های تجزیه و تحلیل و مدیریت داده ها منجر به نابودی سازمان هایی می شود که توانایی کار با تکنولوژی داده های بزرگ را ندارند. مطالعاتی که IDC در طی سال های بسیار، بر روی کاربردهای داده های بزرگ و بازار این تکنولوژی انجام داده است، نشان می دهد که در هر یک از کاربردهای این تکنولوژی برای آنکه حداکثر بهره وری حاصل شود، نیاز است که از ترکیبی از نرم افزار، سخت افزار و سرویس های مختلف استفاده شود. هر چند استفاده گسترده از تکنولوژی داده های بزرگ، در ابتدا برای انجام محاسباتی که دارای کارایی بالا می باشند، یا به اختصار HPC، آغاز شد اما روندهای در حال ظهور نشان از آن دارند که با این تکنولوژی، بازار به سرعت در حال رشد و توسعه است و انتظار می رود که به این سرعت نیز افزوده شود.
Mining of data is an important increasingly methodology for extracting and finding the meaningful hidden knowledge in huge archives of data. There are the various negative social perceptions related to mining of data, out of which many are potential discrimination and potential privacy invasion. The potential discrimination consists of unfairly treating and identifying people based on their existence and belonging to a particular group. Data mining and automated data collection techniques such as classification and association rule mining have provided way to taking decisions automatically, such as computation of insurance premium, loan granting or denial, credit card issue etc. If the provided data sets for training are biased in discriminatory (sensitive) attributes such as, race, gender, religion, etc., discriminatory decisions can be taken and may ensue. For avoiding this situations, antidiscrimination methodology like discrimination prevention and discovery have been considered in the data mining. There are mainly two types of discrimination, one is direct discrimination and second is indirect discrimination. Direct discrimination exists in the situations when decisions are taken on the basis of the sensitive attributes. Indirect discrimination exists in the situations when decisions are taken on the basis of the non-sensitive attributes that are strongly correlated with the biased sensitive attributes.
کاوش در داده ها، یک روش شناختی مهم برای استخراج و یافتن دانش و مفاهیم پنهان در آرشیوهای بزرگ داده، محسوب می شود. در ارتباط با کاوش داده ها، از نظر اجتماعی، درک های منفی و متفاوتی وجود دارد؛ که بسیاری از این ادراکات، تبعیض پنهانی و تهاجم پنهانی به حریم خصوصی محسوب می شوند. تبعیض پنهانی، شامل رفتار ناعادلانه افراد و شناسایی افراد براساس وجود آنها و تعلق آنها به یک گروه خاص می باشد. داده کاوی و تکنیک های خودکار جمع آوری داده، همچون دسته بندی و کاوش قانون انجمن، روشی را برای تصمیم گیری به صورت خودکار ارائه می دهند، مانند محاسبه حق بیمه، موافقت با وام یا رد شدن درخواست وام، شماره کارت اعتباری و غیره. اگر مجموعه داده های آموزشی ارائه شده، نسبت به ویژگی های تبعیض آمیز همچون نژاد، جنسیت، مذهب و غیره، حساس باشند، ممکن است تصمیمات اتخاذ شده، تبعیض آمیز باشند. برای جلوگیری از این موارد، روش های ضد تبعیض، همچون پیشگیری از تبعیض و کشف تبعیض، در داده-کاوی مورد توجه قرار گرفته اند. به طور عمده، دو نوع تبعیض وجود دارد، تبعیض مستقیم و تبعیض غیرمستقیم. تبعیض مستقیم، در شرایطی ایجاد می شود که تصمیم گیری براساس ویژگی های حساس انجام می شود. تبعیض غیر مستقیم، در شرایطی ایجاد می شود که تصمیم گیری براساس خصوصیات غیرحساس انجام می شود؛ که ویژگی های غیرحساس به شدت با ویژگی های حساس مرتبط هستند.