ÃÑ 251ÆäÀÌÁö
23ÆäÀÌÁö º»¹®½ÃÀÛ
Á¦¥°Àå. ¼ ·Ð
9
Á¦¥±Àå¿¡¼´Â ¼±Ç࿬±¸¸¦ °íÂûÇÑ´Ù. ¼±Ç࿬±¸´Â Áö¹æ¼Ò¸ê ¿äÀÎÀ» ºÐ¼®ÇÑ ¿¬±¸¿Í Áö¿ª ±ÕÇü
¹ßÀü ÁöÇ¥¸¦ °³¹ßÇÑ ¿¬±¸·Î ³ª´©¾î °íÂûÇÑ´Ù. ¹®Çå °íÂû °á°ú¸¦ Åä´ë·Î ÀÌ ¿¬±¸ÀÇ Â÷º°¼ºÀÌ
¹«¾ùÀÎÁö¸¦ »ìÆ캸°í, ÀÌ ¿¬±¸¸¦ ÅëÇØ ±â´ëµÇ´Â È¿°ú´Â ¹«¾ùÀÎÁö¸¦ ¼¼úÇÑ´Ù.
Á¦¥²Àå¿¡¼´Â ¿¬±¸¿¡¼ »ç¿ëÇÒ ºÐ¼® ´ë»ó ÀڷḦ °ËÅäÇÏ°í, ÀÚ·áÀÇ ¼öÁý?±¸Ãà ¹æ¹ýÀ» ¼Ò°³
ÇÑ´Ù. ºÐ¼® ´ë»ó ÀÚ·á´Â Å©°Ô Á¾¼Óº¯¼öÀÎ Áö¹æ¼Ò¸êÀ§ÇèÁö¼ö¿Í µ¶¸³º¯¼ö(¿äÀÎ)ÀÎ Áö¿ªÆ¯¼ºÁöÇ¥
·Î ³ª´¶´Ù. Áö¹æ¼Ò¸êÀ§ÇèÁö¼ö´Â ±âÁ¸ ¹®Çå¿¡¼ »ç¿ëµÈ Áö¼ö ¿Ü¿¡ »çȸÀû °æÇâÀ» ¹Ý¿µÇÑ ½Å±Ô
Áö¼ö¸¦ Á¦¾ÈÇÑ´Ù. Áö¿ªÆ¯¼º ÁöÇ¥´Â ±âÁ¸ ÀçÁ¤ÅõÀÚ»ç¾÷¿¡¼ Áö¿ª±ÕÇü¹ßÀüÀ» À§ÇÑ Á¤Ã¥Àû ºÐ¼®
ÁöÇ¥·Î ¹ü¿ëÀûÀ¸·Î »ç¿ëµÇ°í ÀÖ´Â Çѱ¹°³¹ß¿¬±¸¿ø °ø°øÅõÀÚ»ç¾÷°ü¸®¼¾ÅÍ(PIMAC)ÀÇ ¡¸Áö¿ª³«
ÈĵµÁöÇ¥¡¹¿Í Çѱ¹Áö¹æÇàÁ¤¿¬±¸¿ø Áö¹æÅõÀÚ»ç¾÷°ü¸®¼¾ÅÍ(LIMAC)ÀÇ ¡¸Áö¿ª¹ßÀüÁöÇ¥¡¹¸¦ Áö¿ª Ư
¼º ÁöÇ¥·Î È°¿ëÇÑ´Ù. ¿©±â¿¡ Áö¿ªÀÇ ¸Å·Âµµ¿¡ ¿µÇâÀ» ¹ÌÄ¡´Â Áö¹æÁ¤ºÎÀÇ ±â´ÉÀû ¿ä¼Ò·Î Á¤ºÎ
±â´ÉºÐ·ù(COFOG) ÁöÇ¥¸¦ Ãß°¡ÀûÀ¸·Î °í·ÁÇÑ´Ù. ±×¸®°í ºÐ¼® ´ë»ó ÀڷḦ ¼öÁýÇÏ°í ±¸ÃàÇÏ
±â À§ÇÑ ¹æ¹ýÀ» ¼Ò°³ÇÑ´Ù.
Á¦¥³Àå¿¡¼´Â ±¸ÃàµÈ ÀÚ·á¿¡ ´ëÇÑ Å½»öÀû ÀÚ·á ºÐ¼®(EDA)À» ¼öÇàÇÑ´Ù. EDA¸¦ ¼öÇàÇϱâ
¾Õ¼ ºÐ¼®¿¡ »ç¿ëµÈ µ¥ÀÌÅͼ¼Æ®ÀÇ ±¸¼º ¹× µ¥ÀÌÅÍ Àüó¸® ¹æ¹ýÀ» ¼Ò°³ÇÑ´Ù. ±×¸®°í Á¾¼Óº¯¼ö
ÀÎ Áö¹æ¼Ò¸êÀ§ÇèÁö¼ö¿Í ÀÌ¿¡ ¿µÇâ ¹ÌÄ¡´Â Áö¿ª Ư¼º(feature) ÁöÇ¥µéÀ» ¿äÀκ¯¼ö·Î ±¸¼ºÇÏ¿©
ÀÚ·áµéÀÇ Æ¯¼º ¹× »óÈ£ °ü°è µîÀ» Ž»öÇÑ´Ù. ºÐ¼®ÀÇ ¼ø¼´Â Áö¹æ¼Ò¸êÀ§ÇèÁö¼ö, ±× ´ÙÀ½Àº ¿äÀÎ,
³¡À¸·Î Áö¹æ¼Ò¸ê ¿µÇâ¿äÀÎÀÇ Áö¿ªº° Ư¼º ºÐ¼® ¼øÀ¸·Î ÁøÇàÇÑ´Ù. °¢ ºÐ¼® ÀýÂ÷¸¶´Ù »ç¿ëµÈ
¹æ¹ý·Ð°ú À̸¦ ÀÌ ¿¬±¸¿¡¼ ¾î¶»°Ô ±¸ÇöÇß´ÂÁö ±×¸®°í ºÐ¼® °á°ú´Â ¾î¶°Çß´ÂÁö¸¦ ±â¼úÇÑ´Ù.
Á¦¥´Àå¿¡¼´Â °è·®¸ðÇüÀ» ÀÌ¿ëÇÏ¿© Áö¹æ¼Ò¸ê ¿äÀÎÀÇ ¿µÇâÀ» ÃßÁ¤ÇÑ´Ù. ÀÌ Àå¿¡¼´Â ´Ù¾çÇÑ
Áö¿ªº° Ư¼ºµéÀÌ Áö¹æ¼Ò¸ê¿¡ ¹ÌÄ¡´Â ¿µÇâÀ» ȸ±ÍºÐ¼®À» ÅëÇØ ÃßÁ¤ÇÑ´Ù. ¸ÕÀú ÃßÁ¤ ¹æ¹ý¿¡¼
´Â ºÐ¼®¸ðÇüÀ¸·Î »ç¿ëµÉ ȸ±Í½Ä(¸ðÇü 1)À» ¼ö¸³ÇÏ°í, °üÃø ÀÚ·áÀÇ ºÐ»ê ±¸Á¶¸¦ »ìÇǾî ÁÖ¾îÁø
º¯µ¿À» °¡Àå ÀûÇÕÇÏ°Ô ÅëÁ¦ÇÒ ¼ö ÀÖ´Â ÃßÁ¤¹ýÀ» ±¸»óÇÑ´Ù. µ¶¸³º¯¼ö¸¦ ¼±º°ÇÏ´Â ±âÁØÀ» ¼ö¸³
ÇÏ°í ÀÌ¿¡ µû¶ó ¼±º°µÈ º¯¼öµéÀÇ ÀûÀý¼ºÀ» ³íÀÇÇÑ´Ù. ´õÇÏ¿© Áö¹æ¼Ò¸êÀ§ÇèÁö¼ö¿¡ ¿µÇâÀ» ÁÖ
´Â ¿äÀεéÀÇ Áö¿ªº° °ÝÂ÷¸¦ ±¤¿ª ÁöÀÚü ´ÜÀ§(¸ðÇü 2), Àα¸°¨¼Ò ÁöÁ¤Áö¿ª ¹× Àα¸°¨¼Ò °ü½É
Áö¿ª ´ÜÀ§(¸ðÇü 3)·Î »ìÆ캸±â À§ÇØ Ãß°¡ÀûÀΠȸ±Í¸ðÇüÀ» ¼ö¸³ÇÏ¿´À¸¸ç, ¸ðÇüÃßÁ¤ °á°ú µµÃâ
µÇ´Â ¿äÀεéÀÇ °è¼ö¿¡¼ Áö¿ªº° °ÝÂ÷¸¦ °è»êÇÏ´Â ¿ø¸®¸¦ ¼³¸íÇÑ´Ù. ³¡À¸·Î Á¦¾ÈµÈ ¼¼ °¡Áö
¸ðÇüÀÇ ÃßÁ¤ °á°ú¸¦ Á¦½ÃÇÏ°í, À̸¦ ÇÔÀǸ¦ º¸Å Çؼ®ÇÑ´Ù.
Á¦¥µÀå¿¡¼´Â ¸Ó½Å·¯´× ¸ðÇüÀ» ÀÌ¿ëÇÏ¿© Áö¹æ¼Ò¸ê ¿äÀÎÀÇ ¿µÇâÀ» ÃßÁ¤ÇÑ´Ù. ¹æ¹ý·Ð¿¡¼´Â
¸Ó½Å·¯´×ÀÇ ºÐ·ù¸ðÇüÀ» ÀÌ¿ëÇÏ¿© Áö¹æ¼Ò¸ê ¿äÀÎÀÇ ¿µÇâÀ» ÃßÁ¤ÇÑ´Ù. ¸ÕÀú, ºÐ·ù¸ðÇüÀ¸·Î »ç
¿ëµÈ Multinomial Logistic Regression(MLR), Support Vector Machine, K-Nearest
Neighbors, ÀÇ»ç°áÁ¤³ª¹«(Decision Tree), Bagging & Random Forest, Boosting &
Gradient BoostÀÇ ºÐ·ù ¿ø¸®¸¦ ¼¼úÇÏ°í, ÀÌ ¿¬±¸¿¡¼ »ç¿ëÇÑ ¸ðÇü Æò°¡ ¹æ¹ýÀ» ¼Ò°³ÇÑ´Ù.
9
Á¦¥±Àå¿¡¼´Â ¼±Ç࿬±¸¸¦ °íÂûÇÑ´Ù. ¼±Ç࿬±¸´Â Áö¹æ¼Ò¸ê ¿äÀÎÀ» ºÐ¼®ÇÑ ¿¬±¸¿Í Áö¿ª ±ÕÇü
¹ßÀü ÁöÇ¥¸¦ °³¹ßÇÑ ¿¬±¸·Î ³ª´©¾î °íÂûÇÑ´Ù. ¹®Çå °íÂû °á°ú¸¦ Åä´ë·Î ÀÌ ¿¬±¸ÀÇ Â÷º°¼ºÀÌ
¹«¾ùÀÎÁö¸¦ »ìÆ캸°í, ÀÌ ¿¬±¸¸¦ ÅëÇØ ±â´ëµÇ´Â È¿°ú´Â ¹«¾ùÀÎÁö¸¦ ¼¼úÇÑ´Ù.
Á¦¥²Àå¿¡¼´Â ¿¬±¸¿¡¼ »ç¿ëÇÒ ºÐ¼® ´ë»ó ÀڷḦ °ËÅäÇÏ°í, ÀÚ·áÀÇ ¼öÁý?±¸Ãà ¹æ¹ýÀ» ¼Ò°³
ÇÑ´Ù. ºÐ¼® ´ë»ó ÀÚ·á´Â Å©°Ô Á¾¼Óº¯¼öÀÎ Áö¹æ¼Ò¸êÀ§ÇèÁö¼ö¿Í µ¶¸³º¯¼ö(¿äÀÎ)ÀÎ Áö¿ªÆ¯¼ºÁöÇ¥
·Î ³ª´¶´Ù. Áö¹æ¼Ò¸êÀ§ÇèÁö¼ö´Â ±âÁ¸ ¹®Çå¿¡¼ »ç¿ëµÈ Áö¼ö ¿Ü¿¡ »çȸÀû °æÇâÀ» ¹Ý¿µÇÑ ½Å±Ô
Áö¼ö¸¦ Á¦¾ÈÇÑ´Ù. Áö¿ªÆ¯¼º ÁöÇ¥´Â ±âÁ¸ ÀçÁ¤ÅõÀÚ»ç¾÷¿¡¼ Áö¿ª±ÕÇü¹ßÀüÀ» À§ÇÑ Á¤Ã¥Àû ºÐ¼®
ÁöÇ¥·Î ¹ü¿ëÀûÀ¸·Î »ç¿ëµÇ°í ÀÖ´Â Çѱ¹°³¹ß¿¬±¸¿ø °ø°øÅõÀÚ»ç¾÷°ü¸®¼¾ÅÍ(PIMAC)ÀÇ ¡¸Áö¿ª³«
ÈĵµÁöÇ¥¡¹¿Í Çѱ¹Áö¹æÇàÁ¤¿¬±¸¿ø Áö¹æÅõÀÚ»ç¾÷°ü¸®¼¾ÅÍ(LIMAC)ÀÇ ¡¸Áö¿ª¹ßÀüÁöÇ¥¡¹¸¦ Áö¿ª Ư
¼º ÁöÇ¥·Î È°¿ëÇÑ´Ù. ¿©±â¿¡ Áö¿ªÀÇ ¸Å·Âµµ¿¡ ¿µÇâÀ» ¹ÌÄ¡´Â Áö¹æÁ¤ºÎÀÇ ±â´ÉÀû ¿ä¼Ò·Î Á¤ºÎ
±â´ÉºÐ·ù(COFOG) ÁöÇ¥¸¦ Ãß°¡ÀûÀ¸·Î °í·ÁÇÑ´Ù. ±×¸®°í ºÐ¼® ´ë»ó ÀڷḦ ¼öÁýÇÏ°í ±¸ÃàÇÏ
±â À§ÇÑ ¹æ¹ýÀ» ¼Ò°³ÇÑ´Ù.
Á¦¥³Àå¿¡¼´Â ±¸ÃàµÈ ÀÚ·á¿¡ ´ëÇÑ Å½»öÀû ÀÚ·á ºÐ¼®(EDA)À» ¼öÇàÇÑ´Ù. EDA¸¦ ¼öÇàÇϱâ
¾Õ¼ ºÐ¼®¿¡ »ç¿ëµÈ µ¥ÀÌÅͼ¼Æ®ÀÇ ±¸¼º ¹× µ¥ÀÌÅÍ Àüó¸® ¹æ¹ýÀ» ¼Ò°³ÇÑ´Ù. ±×¸®°í Á¾¼Óº¯¼ö
ÀÎ Áö¹æ¼Ò¸êÀ§ÇèÁö¼ö¿Í ÀÌ¿¡ ¿µÇâ ¹ÌÄ¡´Â Áö¿ª Ư¼º(feature) ÁöÇ¥µéÀ» ¿äÀκ¯¼ö·Î ±¸¼ºÇÏ¿©
ÀÚ·áµéÀÇ Æ¯¼º ¹× »óÈ£ °ü°è µîÀ» Ž»öÇÑ´Ù. ºÐ¼®ÀÇ ¼ø¼´Â Áö¹æ¼Ò¸êÀ§ÇèÁö¼ö, ±× ´ÙÀ½Àº ¿äÀÎ,
³¡À¸·Î Áö¹æ¼Ò¸ê ¿µÇâ¿äÀÎÀÇ Áö¿ªº° Ư¼º ºÐ¼® ¼øÀ¸·Î ÁøÇàÇÑ´Ù. °¢ ºÐ¼® ÀýÂ÷¸¶´Ù »ç¿ëµÈ
¹æ¹ý·Ð°ú À̸¦ ÀÌ ¿¬±¸¿¡¼ ¾î¶»°Ô ±¸ÇöÇß´ÂÁö ±×¸®°í ºÐ¼® °á°ú´Â ¾î¶°Çß´ÂÁö¸¦ ±â¼úÇÑ´Ù.
Á¦¥´Àå¿¡¼´Â °è·®¸ðÇüÀ» ÀÌ¿ëÇÏ¿© Áö¹æ¼Ò¸ê ¿äÀÎÀÇ ¿µÇâÀ» ÃßÁ¤ÇÑ´Ù. ÀÌ Àå¿¡¼´Â ´Ù¾çÇÑ
Áö¿ªº° Ư¼ºµéÀÌ Áö¹æ¼Ò¸ê¿¡ ¹ÌÄ¡´Â ¿µÇâÀ» ȸ±ÍºÐ¼®À» ÅëÇØ ÃßÁ¤ÇÑ´Ù. ¸ÕÀú ÃßÁ¤ ¹æ¹ý¿¡¼
´Â ºÐ¼®¸ðÇüÀ¸·Î »ç¿ëµÉ ȸ±Í½Ä(¸ðÇü 1)À» ¼ö¸³ÇÏ°í, °üÃø ÀÚ·áÀÇ ºÐ»ê ±¸Á¶¸¦ »ìÇǾî ÁÖ¾îÁø
º¯µ¿À» °¡Àå ÀûÇÕÇÏ°Ô ÅëÁ¦ÇÒ ¼ö ÀÖ´Â ÃßÁ¤¹ýÀ» ±¸»óÇÑ´Ù. µ¶¸³º¯¼ö¸¦ ¼±º°ÇÏ´Â ±âÁØÀ» ¼ö¸³
ÇÏ°í ÀÌ¿¡ µû¶ó ¼±º°µÈ º¯¼öµéÀÇ ÀûÀý¼ºÀ» ³íÀÇÇÑ´Ù. ´õÇÏ¿© Áö¹æ¼Ò¸êÀ§ÇèÁö¼ö¿¡ ¿µÇâÀ» ÁÖ
´Â ¿äÀεéÀÇ Áö¿ªº° °ÝÂ÷¸¦ ±¤¿ª ÁöÀÚü ´ÜÀ§(¸ðÇü 2), Àα¸°¨¼Ò ÁöÁ¤Áö¿ª ¹× Àα¸°¨¼Ò °ü½É
Áö¿ª ´ÜÀ§(¸ðÇü 3)·Î »ìÆ캸±â À§ÇØ Ãß°¡ÀûÀΠȸ±Í¸ðÇüÀ» ¼ö¸³ÇÏ¿´À¸¸ç, ¸ðÇüÃßÁ¤ °á°ú µµÃâ
µÇ´Â ¿äÀεéÀÇ °è¼ö¿¡¼ Áö¿ªº° °ÝÂ÷¸¦ °è»êÇÏ´Â ¿ø¸®¸¦ ¼³¸íÇÑ´Ù. ³¡À¸·Î Á¦¾ÈµÈ ¼¼ °¡Áö
¸ðÇüÀÇ ÃßÁ¤ °á°ú¸¦ Á¦½ÃÇÏ°í, À̸¦ ÇÔÀǸ¦ º¸Å Çؼ®ÇÑ´Ù.
Á¦¥µÀå¿¡¼´Â ¸Ó½Å·¯´× ¸ðÇüÀ» ÀÌ¿ëÇÏ¿© Áö¹æ¼Ò¸ê ¿äÀÎÀÇ ¿µÇâÀ» ÃßÁ¤ÇÑ´Ù. ¹æ¹ý·Ð¿¡¼´Â
¸Ó½Å·¯´×ÀÇ ºÐ·ù¸ðÇüÀ» ÀÌ¿ëÇÏ¿© Áö¹æ¼Ò¸ê ¿äÀÎÀÇ ¿µÇâÀ» ÃßÁ¤ÇÑ´Ù. ¸ÕÀú, ºÐ·ù¸ðÇüÀ¸·Î »ç
¿ëµÈ Multinomial Logistic Regression(MLR), Support Vector Machine, K-Nearest
Neighbors, ÀÇ»ç°áÁ¤³ª¹«(Decision Tree), Bagging & Random Forest, Boosting &
Gradient BoostÀÇ ºÐ·ù ¿ø¸®¸¦ ¼¼úÇÏ°í, ÀÌ ¿¬±¸¿¡¼ »ç¿ëÇÑ ¸ðÇü Æò°¡ ¹æ¹ýÀ» ¼Ò°³ÇÑ´Ù.
23ÆäÀÌÁö º»¹®³¡
¸Þ´º
ÇöÀç Æ÷Ä¿½ºÀÇ ¾Æ·¡³»¿ëµéÀº µ¿ÀÏÇÑ ÄÁÅÙÃ÷¸¦ °¡Áö°í ÆäÀÌÁö³Ñ±è È¿°ú¹× ½Ã°¢Àû È¿°ú¸¦ Á¦°øÇÏ´Â ÆäÀÌÁöÀ̹ǷΠ½ºÅ©¸°¸®´õ »ç¿ëÀÚ´Â ¿©±â±îÁö¸¸ ³¶µ¶ÇϽðí À§ÀÇ ÆäÀÌÁöÀ̵¿ ¸µÅ©¸¦ »ç¿ëÇÏ¿© ´ÙÀ½ÆäÀÌÁö·Î À̵¿ÇϽñ⠹ٶø´Ï´Ù.