د ناوری اطلاعات دانشكدة مديريت دانشگاه تهران
دورة 6، شمارة 1 بهار 1313
صص 46- 31

مدل رتبه بندي اعتباري هيبريدي با استفاده از الگوريتم هاي ژنتيك و سيستم هاي خبرة فازي
(مطالعة موردي: مؤسسة مالي و اعتباري قوامين)
محمدتقي تقوي فرد1، فريبا سادات حسيني2، محمد خان بابايي3
چكيده: سيستم هاي خبره مي توانند به ساخت مدل هاي رتبه بندي اعتباري مشـتريان بانـك هـا كمك كنند. در اينجا، انتخاب ويژگي هاي مهم در رتبـه بنـدي اعتبـاري اهم يـت دارد. همچنـين ممكن است مقادير وي ژگيها، به صورت فازي بيان شوند. مسـئله ا يـن اسـت ، چگونـه مـي تـوان بهكمك الگوريتم ژنتيك، انتخاب ويژگي ها را بهبود بخشيد؛ به گونه اي كه اين ويژگي ها بهمنزلة ورودي در سيستم خبرة فازي مورد استفاده قرار گيرند. اين نوشـتار بـه ارائـة مـدل رتبـه بنـدي اعتباري هيبريدي با تركيب انتخاب ويژگي ها، مبتني بر الگوريتم ژنتيك و سيستم خبـرة فـازي مي پردازد. پژوهشي كه در اين مورد انجـام گرفـت ، از نظـر نتـايج، كـاربردي و از نظـر هـدف، توصيفي از نوع مطالعة موردي است. براي آموزش و آزمون مـدل، از مجموعـه داده هـاي رتبـه بندي اعتباري مؤسسة مالي و اعتباري قوامين استفاده شده است. پس از پيش پـردازش داده هـا،به كمك الگوريتم ژنت يـك وي ژگـيهـا انتخـاب شـدند و از طر يـق مصـاحبه بـا فـردي خبـره و بهكارگيري منطق فازي، دامنة تغييرات وي ژگيهاي منتخب تعيين شـده و سـپس قـوانين فـازي رتبه بندي اعتباري ايجاد شدند. براي تحليل داده ها از ابزار وكا و ماژول سيستم استنتاج فازي در نرمافزار متلب استفاده شده است. نتايج نشان مي دهد، دقت طبقه بندي مدل پيشنهادي نسبت به ساير روش هاي مقايسه شده در اين مقاله بي شـتر اسـت . قـوان ين فـازي ايجاد شـدة ا يـن مـدل را ميتوان براي رتبه بندي اعتباري مشتريان بانكي بهكار برد.
واژه هاي كليدي: الگوريتم ژنتيك، رتبه بندي اعتباري، سيستم خبره، منطق فازي.

استاديار، گروه مهندسي صنايع، دانشكدة مديريت و حسابداري، دانشگاه علامه طباطبايي، تهران، ايران
كارشناس ارشد مديريت فناوري اطلاعات، دانشگاه علامه طباطبايي، تهران، ايران
دانشگاه آزاد اسلامي، واحد علوم و تحقيقات، گروه مدیریت فناوری اطلاعات، تهران، ايران

تاريخ دريافت مقاله: 04/02/1392 تاريخ پذيرش نهايي مقاله: 10/07/1392
نويسندة مسئول مقاله: فريبا سادات حسيني
E-mail: hosseini.fariba1@gmail.com

مقدمه
بانك براي شناسايي مشتريان خود در اعطاي تسهيلات اعتبـار ي، ن يـاز اساسـي بـه شناسـايي و رتبه بندي اعتباري آنها دارد. در حال حاضر مدل ها و روش هاي مختلفي براي رتبه بندي اعتبـاري مشتريان بانك وجود دارد. هدف اصـلي آنهـا، طبقـه بنـدي مشـتريان بـه طبقـه هـاي مشـتريان خوش حساب و مشتريان بدحساب است؛ بنابراين رتبـه بنـدي اعتبـاري، در دامنـة وسـ يع مسـائل طبقه بندي قرار ميگيرد (لي و چن، 2005 ؛ يانگ، لي و ژو، 2011 و لين، 2009).
به طور كلي روش هاي رتبه بندي اعتباري را م يتوان به دو گروه عمدة روشهـاي پارامتريـك
(مانند پروبيت، لوجيت، تحليل تمايزي و رگرسيون لجسـتيك ) و روش ناپارامتريـك و داده كـاوي
(مانند درختان تصميمگيري، شبكه هاي عصبي و سيستم هاي خبره) تقسيم بنـدي كـرد (البـرز ي، محمدپور زرندي و خان بابايي، 1389). برخـي از مـدل هـاي تركي بـي ن يـز در اعتبارسـنجي مـورد استفاده قرار گرفته اند، مثل مدل عصبي فازي، مدل فازي ماشين بردار پشـتيبان و مـدل تركي بـي شبكههاي عصبي (ژائو و همكاران 2011).
روش هاي آماري قديمي، مانند تحليل تمايزي، رگرسيون لجستيك، تحليل پروبيت و لوجيت، از ابتداي ظهور رتبه بندي اعتباري مورد استفاده قرار گرفتند. سپس رويكردها و روش هاي متنـوعديگري چون الگوريتم هاي فازي، الگوريتم هاي ژنتيك، شبكه هاي عصبي و سيسـتم هـاي خبـره ظهور كردند (لي و چن، 2005). يكي از مشكلات استفاده از روش هاي قديمي آماري اين است كـهبراي ورودي هايي با ابعاد بزرگ مناسب نبوده و در اغلب آنها فرض بر اين اسـت كـه رابطـة خطـي ميان متغيرها وجود دارد؛ در حال يكه معمولاً اين رابطه غيرخطي است (خالصي و شكوهي، 1389).
در اين پژوهش از مدل ناپارامتريك و هيبريـ دي سيسـتم خبـرة فـازي و الگـوريتم انتخـاب ويژگي ها مبتني بر الگوريتم ژنتيك، براي ساخت مدل پيشنهادي رتبـه بنـدي اعتبـاري مشـتريان بانكي استفاده مي شود. سيستم خبره م يتواند به بانك ها در مورد تصميم گيري اعطاي تسـهيلات اعتباري به مشتريان كمك كند و يك سيستم پشتيبان تصميم باشد. در اينجا نيز، سي سـتم خبـرة رتبه بندي اعتباري به كارشناسان و مديران بانكي كمك مي كند تا درخصوص اعطاي تسـهيلات اعتباري به متقاضيان، تصميم گيري كنند. همچنين با استفاده از اين سيستم، مي توان به نگهداري دانش فرد خبره در بانكها كمك كرد.
در مقاله اي (البرزي، محمدپورزرندي و خان بابـايي، 1389) از روش هـاي انتخـاب و ي ژگـي هـا مبتني بر الگوريتم ژنتيك براي انتخاب ويژگي هـاي مهـم و سـاخت درختـان تصـميم گ يـري در رتبه بندي اعتباري مشتريان بانك ها استفاده شد. مـدل پي شـنهاديِ ا يـن مقالـه ، از يـك رويكـرد هيبريدي الگوريتم هاي انتخاب ويژگي ها، خوشهبندي، طبقه بندي و الگوريتم ژنتيك بهره م يبرد. مسئلة اصليِ اين مقاله، ساخت يك سيستم خبره است كه بتواند به نحو مناسبي، رتبـه بنـدياعتباري مشتريان خوب و بد بانك ها را انجام دهد. اما چگونه مـي تـوان بـا اسـتفاده از الگـوريتمژنتيك و انتخاب ويژگي ها، به ساخت سيستم خبرة فـازي بـراي رتبـه بنـدي اعتبـاري مشـتريان بانك ها و مؤسسه هاي مالي پرداخت؟ نظرات كارشناسان و خبرگان تسهيلات اعتباري بانـك هـا، ممكن است ماهيت دقيقي نداشته باشد. در اين خصوص مي توان براي اسـتنتاج قـوانين در يـك سيستم خبرة رتبه بندي اعتباري، از منطق فازي بهره جست. پس مدل پيشنهادي در اين مقاله به ساخت سيستم خبره رتبه بندي اعتباري فازي مي پردازد.
معمولاً انبوهي از اطلاعات تكراري و وي ژگـي هـاي اعتبـاري مشـتريان در پايگـاه هـاي داده انباشته مي شود كه ممكن است، موجب كـاهش دقـت طبقـه بنـدي و افـزا يش پيچ يـدگي مـدلرتبه بندي اعتباري شود. در اين خصوص ميتوان با استفاده از روش هاي انتخاب ويژگي، به تعيين وي ژگيهاي مهم در رتبه بندي اعتباري پرداخت. به كارگيري الگـوريتم هـاي انتخـاب وي ژگـي در مدل هاي طبقهبندي داراي فوايد زير است:
كاهش هزينة استخراج ويژگي ها؛
بهبود دقت طبقه بندي (آبدو، 2009)؛
كاهش زمان يادگيري الگوريتم طبقه بندي؛
كاهش تعداد مثال هاي مورد نياز براي يادگيري در مدل طبقه بندي؛
كاهش تعداد ويژگي ها براي افزايش سرعت محاسبات (ژائو و همكاران، 2011).
در طراحي سيستم خبرة فازي رتبه بندي اعتباري، مي توان از الگوريتم انتخاب ويژگي ها براي كاهش پيچيدگي سيستم و افزايش دقت طبقه بندي مشتريان بانكي بهـره بـرد. از سـوي ديگـر ، الگوريتم هاي انتخاب ويژگي فرض مي كنند روابط بين ويژگي هـا خطـي بـوده و از هـم مسـتقل
هستند. بنابراين تعامل و وابستگي بين ويژگي ها را در محاسبات خود در نظر نمي گيرند. همچنين اين الگوريتم ها در هنگام انجام فرايند جست وجو، ممكن است در بهينة محلي قرار گيرند. در اين الگوريتم ها فقط از برخي معيارها براي انتخاب ويژگـي اسـتفاده مـي شـود (خـان بابـايي، 1388).
الگوريتم هاي ژنتيك، به دليل قابليتشان براي رسيدن به راه حل هاي دقيق يا تخمينـي در نـواح ي جستوجوي بسيار بزرگ دنياي واقعي، در مدت زمان مناسـب ، از پركـاربردترين روش هـا بـراي انتخاب ويژگي هستند (ساي و چن، 2010). همچنين به دليل آنكه مسئلة انتخاب ويژگـي از نـوعمسائل سخت است (شهرابي و ذوالقدرشجاعي، 1388)، مي توان از الگـور يتم ژنتيـك در انتخـابويژگي ها استفاده كرد. الگوريتم ژنتيك هنگام انتخاب ويژگي هـا، چنـد متغيـر را همزمـان مـوردبررسي قرار مي دهد. چنانچه ويژگي ها تك به تك ارزيابي شوند، تعامل بـين آنهـا در نظـر گرفتـه نميشود (البرزي، محمدپورزرندي و خان بابايي، 1389).
در اين مقاله به ارائة يك مدل پيشنهادي مناسب رتبه بندي اعتبـاري مشـتريان بانـك هـا ومؤسسه هاي مالي با استفاده از رويكرد هيبريدي انتخاب ويژگي ها مبتني بـر الگـوريتم ژنت يـك و سيستم خبرة فازي، پرداخته مي شود.
پيشينة پژوهش
پژوهش هاي متنوعي در خصوص به كارگيري روش هاي آماري، غيرپارامتريك و هوش مصنوعي براي پشتيباني از فرايندهاي رتبه بندي اعتباري بانك ها انجام گرفته است. براي نمونه مي توان به كاربرد شبكه هاي رگرسيون لجستيك، شبكة عصـبي، درخـت تصـميم گيـري، تحليـل تمـايزي، ماشين بردار پشتيبان و طبقه كننده هاي تركيبي اشاره كرد (البرزي، محمدپورزرندي و خان بابـايي، 1389). همچنين، در برخي پژوهش ها از سيستم هاي خبره براي رتبـه بنـدي اعتبـاري مشـتريان بانكي استفاده شده است. در مقالة كومارا در سال 2006 (آبدو، 2009)، از يك سيستم خبره براي سنجش اعتبار در مؤسسه هاي مالي و صادر كردن پذيره نويسي استفاده شده است. پـي. سـينها و ژاو در سال 2008 (اسليوا و همكـاران ، 2011)، بـه منظـور بهبـود طبقـه بنـدي بـراي وامدادن بـاروش هاي داده كاوي، به تركيب سيستم خبره با اين روش ها پرداختنـد و دانـش خبـره را بـا ا يـن سيستم دريافت كرده و به منزلة ورودي روشهاي داده كاوي مورد استفاده قرار دادند. در مقالة بن ـ ديويد و فرانك (2009) به مقايسة ماشين يادگيري و سيستم خبره در امر طبقه بندي و مسـائلرگرسيوني پرداخته شده است.
پژوهش هاي متعددي به كاربرد روشهاي الگوريتم ژنتيك در انتخاب ويژگي ها پرداختـه انـد
(ساير حوزه هاي علوم و كسب وكار) كه از نتايج آنها مي توان در ا يـن مقالـه بـراي سـاخت مـدلرتبه بندي اعتباري مشتريان بانكي استفاده كرد. ازجمله آنها مي توان بـه تركيـب طبقـه كننـده هـا مبتني بر الگوريتم ژنتيك، به كارگيري الگوريتم هاي ژنتيك براي انتخاب متغيرهـاي ورودي و در تركيب روشهاي انتخاب ويژگي (البرزي، محمدپورزرندي و خانبابايي، 1389) اشاره كرد.
يكي از رويكردها براي بهبود عملكرد طبقه بندي، به كارگيري مدل هـاي ه يبريـدي بـه جـاي استفاده از طبقه كننده هاي مجزا است كه بهتازگي در رتبه بندي اعتبـاري مشـتريان بـانكي مـوردتوجه پژوهشگران واقع شده است (ساي و وو، 2008). در مدل هاي هيبريدي به جاي اسـتفاده ازيك طبقه كننده، از روش هاي مختلف پارامتريك و ناپارامتريك طبقه بندي و خوشـه بنـدي بـراي بهبود عملكرد طبقه بندي استفاده مي شود. برخي از اين مدل ها در رتبه بندي اعتبـاري عبارتنـد از : روش ماشين بردار پشتيبان هيبريدي (چن، ما و ما، 2009)، مدل هيبريدي رگرسيون لجستيك وشبكه هاي عصبي (سينها و ژائو، 2008 ،) مدل هيبريدي روش هـاي خوشـه بنـدي و طبقـه بنـدي (ساي و وو، 2008).
برخي از موارد برجستة مدل پيشنهاديِ اين مقاله، در مقايسه با مدل هاي رتبه بنـدي اعتبـاري ديگر كه به آنها اشاره شد، عبارتند از: 1. استفاده از روشهاي آماده سازي و پيش پردازش داده هـا براي ساخت مدل رتبه بندي اعتباري پيشنهادي؛ 2. به كارگيري روش انتخاب و يژگـي مبتنـي بـرالگوريتم ژنتيك، در انتخاب ويژگي هاي مهم رتبه بندي اعتباري براي طراحي و سـاخت سيسـتم خبرة رتبه بندي اعتباري؛ 3. استفاده از منطق فازي و الگوريتم ژنتيك براي انتخاب ويژگـي هـاي مناسب رتبه بندي اعتباري مشتريان بانكي؛ 4. به كارگيري رويكرد هيبريدي (تركيب الگوريتم هاي انتخاب ويژگي مبتني بر الگوريتم ژنتيك، منطق فازي و سيستم خبره، در ساخت مدل رتبه بنـدي اعتباري مشتريان بانكي) به جاي استفاده از يك طبقه كننده؛ 5. استفاده از منطق فـازي در بيـان مقادير ويژگي هاي رتبه بندي اعتباري براي ساخت قوانين سـنجش اعتبـار مشـتريان در سيسـتم خبرة مدل پيشنهادي.
در برخي از مطالعات و مقاله ها به استفاده از الگوريتم هاي انتخاب ويژگي در ساخت مدل هاي طبقه بندي اشاره شده است، اما پس از جسـت وجـو و بررسـي مطالعـات ، درخصـوص اسـتفاده ازروش هاي انتخاب ويژگي مبتني بر الگوريتم ژنتيك در طراحـي و سـاخت س يسـتم خبـرة فـازي رتبه بندي اعتباري، مطالعه اي ديده نشد.
روششناسي پژوهش
پژوهش پيش رو ، از نظر نتايج، كاربردي و از نظر هدف، توصيفي و از نوع مطالعة موردي است.
براي جمعآوري اطلاعات، از داده هاي موجود در بانك اطلاعـاتي مؤسسـة مـالي و اعتبـاري قوامين و پروندههاي اعتباري مشتريان استفاده شد. پايگاه دادة موجود، شامل 1133 ركـورد و 21 ويژگي است ( با احتساب ويژگي هدف، يعني »معوقات«). مجموعة داده ها كه براي سـاخت مـدلرتبه بندي اعتباري در اين پژوهش به كار مي رود، مشتريان حقيقي سال هاي 1388 و 1389 شـهر تهران هستند كه از بانك تقاضاي وام كردهاند. متغيرهاي مستقل اين مجموعه، شامل كد حـوزه(اسمي)، كد شعبه (اسمي ،) شـمارة درخواسـت ( اسـمي)، نـوع وام ( اسـمي)، كـد نـوع درخواسـت
(اسمي)، جنسيت (اسمي ،) شمارة شناسنامه (اسمي ،) تاريخ تولد (اسمي ،) نرخ وام ( عـددي ،) مقـدار وام (عددي ،) تعداد اقساط (عددي ،) تاريخ درخواست وام (اسمي ،) تاريخ واريز وام ( اسـمي ،) تـاريخ اولين قسط (اسمي ،) تاريخ آخرين قسط (اسمي) و مانده بدهي (عددي ،) سابقة كار (عددي)، درآمد (عددي)، وضعيت مسكن (اسمي)، ميانگين موجودي حساب در سه ماهة اخيـر ( اسـمي) و متغيـر وابستة آن معوقات (اسمي) است.
اگر تعداد وام هاي معوق يك مشتري سه وام يا بيشتر از آن باشد، فرد جزء مشتريان بدحسابو اگر كمتر از سه باشد، از دسـته مشـتريان خـوش حسـاب اسـت. بـراي آمـاده سـازي داده هـا ازروش هاي زير استفاده شد:
− حذف ويژگيهايي كه داراي مقادير يكتا هستند؛
− حذف برخي ويژگي ها، به دليل عدم ارائة دانش؛
− حذف تراكنش هايي با مقادير مفقود؛
− بررسي وجود اختلال در مجموعه داده؛
− تغيير قالب مقادير ويژگي هايي كه تاريخ دارند.
مدل پيشنهادي
ابتدا با استفاده از الگوريتم ژنتيك، ويژگي هاي مهم براي تعيـين م يـزان اعتبـار مشـتريان بـانكي انتخاب شده اند و سپس با در نظر گرفتن اين مجموعـه و يژگـي ، بـه سـاخت قـوانين رتبـه بنـدي اعتباري فازي پرداخته شد و درنهايت، مجموعه قوانين رتبه بندي اعتباري مشتريان بـانكي بـراي ارزيابي مشتريان به دست آمد. شكل 1 مراحل كلي ساخت سيستم خبرة فازي رتبه بندي اعتبـاري مشتريان بانكي را نشان مي دهد.

داده

مجموعه

هاي
بانكي

مشتريان

اعتباري

ويژگي

انتخاب

مهم

هاي

الگوريتم

از

استفاده

با
ژنتيك

ويژگي

پيش

هاي

گوي

ميزان

تعيين

در

مهم
بانك

مشتريان

اعتبار

قوانين

ساخت
رتبه

اعتباري

بندي
فازي

رتبه

قوانين

مجموعه
بندي
بانكي

مشتريان

اعتباري

داده

مجموعه

هاي

بانكي



قیمت: تومان


پاسخ دهید