|
|
|
Pandas Cookbook : ÆÄÀ̽㠵¥ÀÌÅÍ °úÇÐ ±âÃÊ
|
|
|
µ¥ÀÌÅÍ °úÇÐ ½Ã¸®Áî(¿¡ÀÌÄÜ)1
¤Ó ¸ÅÆ® Çظ®½¼, Å©¶ó½º·¦
¤Ó
¿¡ÀÌÄÜÃâÆÇ
¤Ó
Pandas 1.x Cookbook - Second Edition
|
|
|
|
- Á¦ÈÞ¸ô ÁÖ¹® ½Ã °í°´º¸»ó, ÀϺΠÀ̺¥Æ® Âü¿© ¹× ÁõÁ¤Ç° ÁõÁ¤, ÇÏ·ç/´çÀÏ ¹è¼Û¿¡¼ Á¦¿ÜµÇ¹Ç·Î Âü°í ¹Ù¶ø´Ï´Ù.
-
-
-
pandasÀÇ ¸ðµç ±â´ÉÀ» Ä£ÀýÇÑ ¿¹Á¦¿Í ¼³¸í, ½ÇÁ¦ ÆÄÀ̽ã Äڵ带 ÅëÇÑ ½Ç½À°ú ÇÔ²² ¼³¸íÇÑ´Ù. pandasÀÇ ÇÙ½É DataFrame°ú Series¸¦ ÁÖÃàÀ¸·Î ÇÔ¼ö, ¸Þ¼µå, ¼Ó¼ºÀ» ¼³¸íÇÏ°í Àå´ÜÁ¡Àº ¹°·Ð ¸Þ¸ð¸® »ç¿ë·®°ú ó¸® ½Ã°£µµ ºñ±³ÇÑ´Ù. ±ÝÀ¶ µ¥ÀÌÅÍ¿¡¼ °¡Àå Áß¿äÇÑ ½Ã°è¿ ÀڷḦ ó¸®ÇÏ´Â ´Ù¾çÇÑ ¹æ¹ý°ú SQL µ¥ÀÌÅͺ£À̽º¿¡ ¿¬°áÇÏ´Â ¹æ¹ýµµ ¾Ë·ÁÁØ´Ù. ÇÑÆí pandas ¶óÀ̺귯¸®ÀÇ ±×·ìÈ ÇÔ¼ö¸¦ üÀÎ ±â´É°ú Áý°èÇÔ¼ö¸¦ °áÇÕÇØ »ç¿ëÇÒ ¶§ pandas ¶óÀ̺귯¸®ÀÇ °·ÂÇÑ ÈûÀ» ´À³¥ ¼ö ÀÖ´Ù.
±×¸®°í Á¤µ·µÈ µ¥ÀÌÅÍ(tidy data)ÀÇ Á¤ÀÇ¿Í ÇÔ²² µ¥ÀÌÅÍ Á¤µ· ¹æ¹ý°ú ÀýÂ÷¸¦ ÀÚ¼¼È÷ ¾Ë¾Æº¸°í matplotlib, python plot, seabornÀ» ÀÌ¿ëÇÑ µ¥ÀÌÅÍ ½Ã°¢È¿Í °¢°¢ÀÇ Àå´ÜÁ¡À» »ó¼¼È÷ ¼³¸íÇÑ´Ù.
-
-
¡Ú ÀÌ Ã¥¿¡¼ ´Ù·ç´Â ³»¿ë ¡Ú
¡á ¸ðµç µ¥ÀÌÅͼÂÀ» Ž»öÇÒ ¼ö ÀÖ°Ô ÇØÁÖ´Â pandasÀÇ ±âº» Áö½Ä
¡á Äõ¸®¿Í ¼±ÅÃÀ¸·Î µ¥ÀÌÅÍ Áß ¿øÇÏ´Â ºÎºÐ¸¸ ºÎºÐÁýÇÕÀ¸·Î ÀûÀýÈ÷ °ñ¶ó³»´Â ¹æ¹ý
¡á µ¥ÀÌÅ͸¦ Á¾ÇÕÇϰųª °¢ ±×·ìÀ¸·Î º¯È¯Çϱâ Àü °³º° ±×·ìÀ¸·Î ºÐÇÒÇÏ´Â ¹æ¹ý
¡á µ¥ÀÌÅÍ ºÐ¼®°ú ½Ã°¢È°¡ ¿ëÀÌÇϵµ·Ï µ¥ÀÌÅ͸¦ Á¤µ·µÈ Çü½ÄÀ¸·Î À籸¼ºÇϱâ
¡á º¹ÀâÇÑ ½ÇÁ¦ ȯ°æ µ¥ÀÌÅ͸¦ ¸Ó½Å·¯´×¿¡¼ »ç¿ëÇÒ ¼ö ÀÖµµ·Ï ÁغñÇϱâ
¡á pandasÀÇ SQL À¯»ç ¿¬»ê ±â´ÉÀ¸·Î ¼·Î ´Ù¸¥ ¼Ò½ºÀÇ µ¥ÀÌÅÍ º´ÇÕÇϱâ
¡á pandasÀÇ µ¶º¸ÀûÀÎ ½Ã°è¿ µ¥ÀÌÅÍ Ã³¸® ´É·Â
¡á pandasÀÇ matplitlib³ª seabornÀ» »ç¿ëÇÑ ½Ã°¢È ±â´É
¡Ú ÀÌ Ã¥ÀÇ ´ë»ó µ¶ÀÚ ¡Ú
´Ü¼øÇÑ ¿¹Á¦¿¡¼ °í±Þ ¿¹Á¦±îÁö °ÅÀÇ 100°¡Áö ¿¹Á¦¸¦ ´Ù·é´Ù. ¸ðµç ¿¹Á¦´Â °£´Ü¸í·áÇÏ°í ÃֽŠÆÄÀ̽㠹®¹ý°ú ±¸¹®À» »ç¿ëÇØ ÀÛ¼ºÇß´Ù. ¡®ÀÛµ¿ ¿ø¸®¡¯ Àý¿¡¼´Â ¿¹Á¦ÀÇ º¹ÀâÇÑ °¢ ´Ü°è¸¦ »ó¼¼È÷ ¼³¸íÇϸç, Á¾Á¾ ¡®Ãß°¡ »çÇס¯ Àý¿¡¼ »õ·Î¿î ¿¹Á¦¿¡ ´ëÇÑ Á¤º¸¸¦ ¾òÀ» ¼ö ÀÖ´Ù.
óÀ½ 6°³ ÀåÀÇ ¿¹Á¦´Â °£´ÜÇÑ ¿¹Á¦·Î ±¸¼ºµÆÀ¸¸ç, ÀÌÈÄ 5°³ Àå¿¡ ºñÇØ ±âº»ÀûÀÌ°í ±Ùº»ÀûÀÎ pandas ¿¬»ê¿¡ ÁßÁ¡À» µÐ´Ù. ³ª¸ÓÁö 5°³ ÀåÀº °í±Þ ¿¬»ê°ú ÇÁ·ÎÁ§Æ® ¼º°ÝÀÌ °ÇÑ ¿¹Á¦¸¦ ¼Ò°³ÇÑ´Ù. ³À̵µ°¡ ±¤¹üÀ§ÇϹǷΠÃʺ¸ÀÚ³ª ¼÷·ÃÀÚ ¸ðµÎ¿¡°Ô À¯¿ëÇÏ´Ù. ³» °æÇè¿¡ ºñÃç ºÃÀ» ¶§ pandas¸¦ ÀÏ»óÀûÀ¸·Î »ç¿ëÇÏ´Â »ç¶÷µµ pandasÀÇ °ü¿ë±¸¿¡ Àͼ÷ÇÏÁö ¾Ê´Ù¸é ¸¶½ºÅÍÇÏÁö ¸øÇÒ °ÍÀÌ´Ù. ÀÌ´Â pandas°¡ ¹æ´ëÇÑ ¿µ¿ªÀ» ´Ù·ç±â ¶§¹®ÀÌ´Ù. ´ëºÎºÐ µ¿ÀÏÇÑ ¿¬»êÀ» ¼öÇàÇÒ ¼ö ÀÖ´Â ¹æ¹ýÀº ¿©·¯ °¡Áö°¡ Àֱ⠶§¹®¿¡ »ç¿ëÀÚ´Â ¿øÇÏ´Â °á°ú¸¦ ¾ò°íÀÚ ºñÈ¿À²ÀûÀÎ ¹æ¹ýÀ» »ç¿ëÇÏ°í ÀÖÀ» ¼öµµ ÀÖ´Ù. µ¿ÀÏÇÑ ¹®Á¦¸¦ ÇØ°áÇÏ´Â pandas ¼Ö·ç¼ÇÀÇ ¼Óµµ Â÷ÀÌ°¡ ¼ö½Ê ¹è ÀÌ»ó ´Ù¸¥ °æ¿ìµµ ºó¹øÇÏ´Ù.
Çʼö Áö½ÄÀº ¿ÀÁ÷ ÆÄÀ̽ã»ÓÀÌ´Ù. µ¶ÀÚ°¡ ¸®½ºÆ®(list), ÁýÇÕ(set), µñ¼Å³Ê¸®(dictionary), Æ©ÇÃ(tuple) µîÀÇ ÆÄÀ̽㠳»Àå µ¥ÀÌÅÍ ÀúÀå¼Ò¿¡ ¾î´À Á¤µµ Àͼ÷ÇÏ´Ù°í °¡Á¤ÇÑ´Ù.
¡Ú ÀÌ Ã¥ÀÇ ±¸¼º ¡Ú
1Àå, ¡®pandas ±âÃÊ¡¯¿¡¼´Â pandas µ¥ÀÌÅÍ ±¸Á¶¸¦ ÀÌ·ç´Â µÎ ±¸¼º ¿ä¼ÒÀÎ Series¿Í DataFrameÀ» ÇغÎÇÏ°í ¿ë¾î¸¦ Á¤¸®ÇÑ´Ù. °¢ ¿Àº µ¿ÀÏÇÑ µ¥ÀÌÅÍ Çü½ÄÀ» °¡Á®¾ß ÇÏ°í ¿ì¸®´Â °¢ µ¥ÀÌÅÍ Çü½ÄÀ» ¾Ë¾Æº»´Ù. À̸¦ ÅëÇØ Series¿Í DataFrameÀÇ ¸Þ¼µå¸¦ È£ÃâÇÏ°í ¹Ù²Ù¸é¼ µÎ ¿ä¼ÒÀÇ ÁøÁ¤ÇÑ ÈûÀ» ¹è¿ï ¼ö ÀÖ´Ù.
2Àå, ¡®±âº» DataFrame ¿¬»ê¡¯¿¡¼´Â µ¥ÀÌÅÍ ºÐ¼®À» À§ÇØ °¡Àå Áß¿äÇÏ°í º¸ÆíÀûÀÎ ¿¬»êÀ» ¾Ë¾Æº»´Ù.
3Àå, ¡®DataFrame »ý¼º°ú À¯Áö¡¯¿¡¼´Â DataFrameÀ» »ý¼ºÇÏ°í °ªÀ» ³Ö´Â ´Ù¾çÇÑ ¹æ¹ýÀ» ¾Ë¾Æº»´Ù.
4Àå, ¡®µ¥ÀÌÅÍ ºÐ¼® ½ÃÀÛ¡¯¿¡¼´Â µ¥ÀÌÅ͸¦ ÀÐ¾î µéÀÎ ÈÄ, ÇØ¾ß ÇÒ ¹Ýº¹ ÀÛ¾÷¿¡ µµ¿òÀÌ µÇ´Â ³»¿ëÀ» ´Ù·é´Ù.
5Àå, ¡®Å½»öÀû µ¥ÀÌÅÍ ºÐ¼®¡¯¿¡¼´Â ¼öÄ¡¿Í ¹üÁÖ µ¥ÀÌÅ͸¦ ºñ±³ÇÏ´Â ±âº» ºÐ¼® ±â¹ýÀ» ´Ù·é´Ù. ¶ÇÇÑ ÀϹÝÀûÀÎ ½Ã°¢È ±â¹ýµµ ¾Ë¾Æº»´Ù.
6Àå, ¡®µ¥ÀÌÅÍÀÇ ºÎºÐÁýÇÕ ¼±Å᯿¡¼´Â ¼·Î ´Ù¸¥ ºÎºÐÁýÇÕ ¼±Åÿ¡¼ ´Ù¾çÇÏ°í È¥µ¿µÇ´Â ºÎºÐ µî ¿©·¯ ÁÖÁ¦¸¦ ´Ù·é´Ù.
7Àå, ¡®Çà ÇÊÅ͸µ¡¯¿¡¼´Â ºÒ¸®¾ð Á¶°ÇÀ» ÀÌ¿ëÇØ µ¥ÀÌÅÍÀÇ ºÎºÐÁýÇÕÀ» ¼±ÅÃÇÏ´Â Äõ¸® ÇÁ·Î¼¼½º¸¦ ´Ù·é´Ù.
8Àå, ¡®À妽º Á¤·Ä¡¯¿¡¼´Â »ó´çÈ÷ Áß¿äÇϸ鼵µ Á¾Á¾ À߸ø ÀÌÇØÇÏ°í ÀÖ´Â À妽º °´Ã¼¸¦ ´Ù·é´Ù. À妽º¸¦ À߸ø ´Ù·ç¸é ¸¹Àº À߸øµÈ °á°ú¸¦ ÃÊ·¡ÇÑ´Ù. ¿¹Á¦¿¡¼ °·ÂÇÑ °á°ú¸¦ ¾òÀ» ¼ö ÀÖ´Â ¿Ã¹Ù¸¥ »ç¿ë¹ýÀ» ¾Ë¾Æº»´Ù.
9Àå, ¡®±×·ìȸ¦ À§ÇÑ Áý°è, ¿©°ú, º¯È¯¡¯¿¡¼´Â µ¥ÀÌÅÍ ºÐ¼®¿¡ ÇÊ¿äÇÑ °·ÂÇÑ ±×·ìÈ ±â´ÉÀ» ´Ù·é´Ù. µû¶ó¼ ¸ñÀû¿¡ ¸Â´Â ±×·ì¿¡ Àû¿ëÇÒ »ç¿ëÀÚ Á¤ÀÇ ÇÔ¼ö¸¦ ±¸¼ºÇÒ ¼ö ÀÖ´Ù.
10Àå, ¡®Á¤µ·µÈ Çü½ÄÀ¸·Î µ¥ÀÌÅÍ À籸¼º¡¯¿¡¼´Â Á¤µ·µÈ µ¥ÀÌÅ͸¦ ¼³¸íÇÏ°í Áß¿äÇÑ ÀÌÀ¯¸¦... ¾Ë¾Æº¸°í ¼·Î ´Ù¸¥ ÇüÅÂÀÇ µ¥ÀÌÅ͸¦ Á¤µ·ÇÏ´Â ¹æ¹ýÀ» ´Ù·é´Ù.
11Àå, ¡®pandas °´Ã¼ º´ÇÕ¡¯¿¡¼´Â DataFrame°ú Series¸¦ ¼öÁ÷°ú ¼öÆòÀ¸·Î º´ÇÕÇÏ´Â ¿©·¯ ¸Þ¼µå¸¦ ¾Ë¾Æº»´Ù. ¶ÇÇÑ À¥ ½ºÅ©·¡ÇÎÀ¸·Î Æ®·³ÇÁ¿Í ¿À¹Ù¸¶ ´ëÅë·ÉÀÇ ±¹Á¤ ¼öÇà Æò°¡ Á¡¼ö¸¦ ºñ±³ÇÏ°í À¥ ½ºÅ©·¡Çΰú SQL °ü°èÇü µ¥ÀÌÅͺ£À̽º ¿¬°áÀ» ½Ç½ÀÇغ»´Ù.
12Àå, ¡®½Ã°è¿ ºÐ¼®¡¯¿¡¼´Â °¡´ÉÇÑ ¸ðµç ½Ã°£ Â÷¿ø¿¡ µû¶ó ºÐÇØÇÒ ¼ö ÀÖ´Â ½Ã°è¿ÀÇ °·ÂÇÑ °í±Þ ±â´ÉÀ» ¾Ë¾Æº»´Ù.
13Àå, ¡®matplotlib, pandas, seabornÀ» ÀÌ¿ëÇÑ ½Ã°¢È¡¯¿¡¼´Â pandas¿¡¼ ¸ðµç µµ½ÄÈÀÇ ±âº»ÀÌ µÇ´Â matplotlib ¶óÀ̺귯¸®¸¦ ¼Ò°³ÇÑ´Ù. ±×¸®°í pandas plot ¸Þ¼µå¿Í seaborn ¶óÀ̺귯¸® µî pandas¿¡¼ Á÷Á¢ Á¦°øÇÏÁö ¾Ê´Â ´Ù¾çÇÏ°í ½É¹ÌÀûÀÎ ½Ã°¢È ±â´ÉÀ» ¾Ë¾Æº»´Ù.
14Àå, ¡®pandas µð¹ö±ë°ú Å×½ºÆ®¡¯¿¡¼´Â DataFrame°ú pandas Äڵ带 Å×½ºÆ®ÇÏ´Â ¸ÞÄ¿´ÏÁòÀ» »ìÆ캻´Ù. »ý»ê ¶óÀο¡ pandas¸¦ ¹èÆ÷ÇÒ °èȹÀ̶ó¸é ÀÌ ÀåÀ» ÅëÇØ Äڵ带 ½Å·ÚÇÒ ¼ö ÀÖ°Ô µ½´Â´Ù.
-
-
1Àå. pandas ±âÃÊ
__pandas ÀÓÆ÷Æ®
__¼Ò°³
__pandas DataFrame
__DataFrame ¼Ó¼º
__µ¥ÀÌÅÍ Çü½Ä ÀÌÇØ
__¿ ¼±ÅÃ
__Series ¸Þ¼µå È£Ãâ
__Series ¿¬»ê
__Series ¸Þ¼µå üÀÎ
__¿ À̸§ º¯°æ
__¿ÀÇ »ý¼º°ú »èÁ¦
2Àå. ±âº» DataFrame ¿¬»ê
__¼Ò°³
__¿©·¯ DataFrame ¿ ¼±ÅÃ
__¸Þ¼µå¸¦ »ç¿ëÇØ ¿ ¼±ÅÃ
__¿ À̸§ Á¤·Ä
__DataFrame ¿ä¾à
__DataFrame ¸Þ¼µå üÀÎ
__DataFrame ¿¬»ê
__°áÃøÄ¡ ºñ±³
__DataFrame ¿¬»ê ¹æÇâ Àüȯ
__´ëÇÐ ÀÎÁ¾ ´Ù¾ç¼º Áö¼ö °áÁ¤
3Àå. DataFrame »ý¼º°ú À¯Áö
__¼Ò°³
__½ºÅ©·¡Ä¡¿¡¼ DataFrame »ý¼º
__CSV ÀÛ¼º
__´ëÇü CSV ÆÄÀÏ Àбâ
__¿¢¼¿ ÆÄÀÏ »ç¿ë
__ZIP ÆÄÀÏ·Î ÀÛ¾÷
__µ¥ÀÌÅͺ£À̽º¿Í ÀÛ¾÷
__JSON ÆÄÀÏ Àбâ
__HTML Å×À̺í Àбâ
4Àå. µ¥ÀÌÅÍ ºÐ¼® ½ÃÀÛ
__¼Ò°³
__µ¥ÀÌÅÍ ºÐ¼® ·çƾ °³¹ß
__µ¥ÀÌÅÍ µñ¼Å³Ê¸®
__µ¥ÀÌÅÍ Çü½Ä º¯°æÀ¸·Î ¸Þ¸ð¸® Àý¾à
__ÃÖ´ë Áß¿¡ ÃÖ¼Ò ¼±ÅÃ
__Á¤·ÄÇØ °¢ ±×·ì¿¡¼ °¡Àå Å« Ç׸ñ ¼±ÅÃ
__sort_values¸¦ »ç¿ëÇØ nlargest º¹Á¦
__ÃßÀû ÁöÁ¤°¡ ÁÖ¹® °¡°Ý °è»ê
5Àå. Ž»öÀû µ¥ÀÌÅÍ ºÐ¼®
__¼Ò°³
__¿ä¾à Åë°è·®
__¿ Çü½Ä
__¿¹Á¦ ±¸Çö
__¹üÁÖÇü µ¥ÀÌÅÍ
_..._¿¬¼Ó µ¥ÀÌÅÍ
__¹üÁÖ °£ÀÇ ¿¬¼Ó °ª ºñ±³
__µÎ °³ÀÇ ¿¬¼Ó ¿ ºñ±³
__¹üÁÖ °ª°ú ¹üÁÖ °ª ºñ±³
__pandas ÇÁ·ÎÆÄÀϸµ ¶óÀ̺귯¸® »ç¿ë
6Àå. µ¥ÀÌÅÍÀÇ ºÎºÐÁýÇÕ ¼±ÅÃ
__¼Ò°³
__Series µ¥ÀÌÅÍ ¼±ÅÃ
__DataFrame Çà ¼±ÅÃ
__DataFrame Çà°ú ¿À» µ¿½Ã¿¡ ¼±ÅÃ
__Á¤¼ö¿Í ·¹ÀÌºí ¸ðµÎ·Î µ¥ÀÌÅÍ ¼±ÅÃ
__»çÀü½ÄÀ¸·Î ½½¶óÀ̽Ì
7Àå. Çà ÇÊÅ͸µ
__¼Ò°³
__ºÒ¸®¾ð Åë°è·® °è»ê
__´ÙÁß ºÒ¸®¾ð Á¶°Ç ±¸¼º
__ºÒ¸®¾ð ¹è¿À» »ç¿ëÇÑ ÇÊÅ͸µ
__Çà ÇÊÅ͸µ°ú À妽º ÇÊÅ͸µ ºñ±³
__À¯ÀÏÇÏ°í Á¤·ÄµÈ À妽º¸¦ »ç¿ëÇÑ ¼±ÅÃ
__SQL WHERE Àý Çؼ®
__Äõ¸® ¸Þ¼µå¸¦ »ç¿ëÇÑ ºÒ¸®¾ð À妽ÌÀÇ °¡µ¶¼º Çâ»ó
__.where ¸Þ¼µå¸¦ »ç¿ëÇØ Series Å©±â À¯Áö
__DataFrame Çà ¸¶½ºÅ·
__ºÒ¸®¾ð, Á¤¼ö À§Ä¡, ·¹À̺íÀ» »ç¿ëÇØ ¼±ÅÃ
8Àå. À妽º Á¤·Ä
__¼Ò°³
__À妽º °´Ã¼ °Ë»ç
__µ¥Ä«¸£Æ® °ö »ý¼º
__À妽º Æø¹ß
__µ¿ÀÏÇÏÁö ¾ÊÀº À妽º·Î °ª ä¿ì±â
__´Ù¸¥ DataFrameÀÇ ¿ ´õÇϱâ
__°¢ ¿ÀÇ ÃÖ´ñ°ª °Á¶
__¸Þ¼µå üÀÎÀ¸·Î idxmax º¹Á¦
__¿¿¡¼ ÃÖ´ë °øÅë ÃÖ´ñ°ª ã±â
9Àå. ±×·ìȸ¦ À§ÇÑ Áý°è, ¿©°ú, º¯È¯
__¼Ò°³
__Áý°è Á¤ÀÇ
__º¹¼ö ¿°ú ÇÔ¼ö¸¦ »ç¿ëÇÑ ±×·ìÈ¿Í Áý°è
__±×·ìÈ ÈÄ ´ÙÁß À妽º Á¦°Å
__»ç¿ëÀÚ Á¤ÀÇ Áý°è ÇÔ¼ö¸¦ »ç¿ëÇÑ ±×·ìÈ
__*args¿Í **kwargs¸¦ »ç¿ëÇÑ Áý°è ÇÔ¼ö »ç¿ëÀÚ Á¤ÀÇ
__groupby °´Ã¼ °Ë»ç
__¼Ò¼ö ÀÎÁ¾ÀÌ °ú¹ÝÀÎ ÁÖ¸¦ ÇÊÅ͸µ
__üÁß °¨·® ³»±â¸¦ ÅëÇÑ º¯½Å
__apply¸¦ »ç¿ëÇØ ÁÖº° °¡Áß Æò±Õ SAT Á¡¼ö °è»ê
__¿¬¼Ó º¯¼ö¸¦ ±âÁØÀ¸·Î ±×·ìÈ
__µµ½Ã °£ ÃÑ ºñÇà Ƚ¼ö °è»ê
__°¡Àå ±ä ¿¬¼Ó Á¤½Ã ºñÇà ã±â
10Àå. Á¤µ·µÈ Çü½ÄÀ¸·Î µ¥ÀÌÅÍ À籸¼º
__¼Ò°³
__½ºÅÃÀ» »ç¿ëÇØ º¯¼ö °ªÀ» ¿ À̸§À¸·Î Á¤µ·
__melt¸¦ »ç¿ëÇØ º¯¼ö °ªÀ» ¿ À̸§À¸·Î Á¤µ·
__¿©·¯ º¯¼öÀÇ ±×·ìÀ» µ¿½Ã¿¡ ½ºÅÃ
__½ºÅÃµÈ µ¥ÀÌÅÍ µÇµ¹¸®±â
__groupby Áý°è ÈÄ ¾ð½ºÅÃ
__groupby Áý°è·Î pivot_table º¹Á¦
__¼Õ½¬¿î À籸¼ºÀ» À§ÇÑ Ãà ·¹º§ À̸§ º¯°æ
__¿©·¯ º¯¼ö°¡ ¿ À̸§À¸·Î ÀúÀåµÉ ¶§ÀÇ Á¤µ·
__¿©·¯ º¯¼ö°¡ ´ÜÀÏ ¿·Î ÀúÀåµÉ ¶§ Á¤µ·
__µÑ ÀÌ»óÀÇ °ªÀÌ µ¿ÀÏ ¼¿¿¡ ÀúÀåµÉ ¶§ÀÇ Á¤µ·
__º¯¼ö°¡ ¿ À̸§°ú °ªÀ¸·Î ÀúÀåµÆÀ» ¶§ÀÇ µ¥ÀÌÅÍ Á¤µ·
11Àå. pandas °´Ã¼ º´ÇÕ
__¼Ò°³
__DataFrame¿¡ »õ Çà Ãß°¡
__¿©·¯ DataFrameÀ» ÇÔ²² ¿¬°á
__concat, join, mergeÀÇ Â÷ÀÌÁ¡ ÀÌÇØ
__SQL µ¥ÀÌÅͺ£À̽º¿¡ ¿¬°á
12Àå. ½Ã°è¿ ºÐ¼®
__¼Ò°³
__ÆÄÀ̽ã°ú pandas ³¯Â¥ µµ±¸ÀÇ Â÷ÀÌÁ¡ ÀÌÇØ
__½Ã°è¿À» Áö´ÉÀûÀ¸·Î ½½¶óÀ̽º
__½Ã°£ µ¥ÀÌÅÍ·Î ¿ ÇÊÅ͸µ
__DatetimeIndex¿¡¼¸¸ ÀÛµ¿ÇÏ´Â ¸Þ¼µå »ç¿ë
__ÁÖ°£ ¹üÁË ¼ö °è»ê
__ÁÖ°£ ¹üÁË¿Í ±³Åë»ç°í¸¦ º°µµ·Î Áý°è
__ÁÖº°, ¿¬µµº° ¹üÁË ÃøÁ¤
__timeIndex¸¦ »ç¿ëÇØ À͸í ÇÔ¼ö·Î ±×·ìÈ
__Timestamp¿Í ´Ù¸¥ ¿À» ±âÁØÀ¸·Î ±×·ìÈ
13Àå. matplotlib, pandas, seabornÀ» ÀÌ¿ëÇÑ ½Ã°¢È
__¼Ò°³
__matplotlib·Î ½ÃÀÛ
__matplotlib¿¡ ´ëÇÑ °´Ã¼ÁöÇâ °¡À̵å
__matplotlib·Î µ¥ÀÌÅÍ ½Ã°¢È
__pandas¸¦ »ç¿ëÇÑ ±âº» µµ½ÄÈ
__flights µ¥ÀÌÅͼ ½Ã°¢È
__»õ·Î¿î °æÇâÀ» ¹ß°ßÇϱâ À§ÇÑ ´©Àû ¿µ¿ª Â÷Æ®
__seaborn°ú pandasÀÇ Â÷ÀÌÁ¡
__seaborn ±×¸®µå¸¦ »ç¿ëÇÑ ´Ùº¯·® ºÐ¼®
__seabornÀ¸·Î diamonds µ¥ÀÌÅͼÂÀÇ ½É½¼ ¿ª¼³ ¹ß°ß
14Àå. pandas µð¹ö±ë°ú Å×½ºÆ®
__µ¥ÀÌÅ͸¦ º¯È¯ÇÏ´Â ÄÚµå
__Apply ¼º´É
__Dask, Pandarell, Swifter µîÀ¸·Î apply ¼º´É Çâ»ó
__ÄÚµå °Ë»ç
__Jupyter¿¡¼ÀÇ µð¹ö±ë
__Great Expectations¸¦ ÀÌ¿ëÇÑ µ¥ÀÌÅÍ ¹«°á¼º °ü¸®
__pandas¿Í ÇÔ²² pytest »ç¿ë
__Hypothesis¸¦ »ç¿ëÇØ Å×½ºÆ® »ý¼º
-
-
¡Ú ¿Å±äÀÌÀÇ ¸» ¡Ú
±¸Á¶ÈµÈ µ¥ÀÌÅ͸¦ ´Ù·ê ¶§ ÃÖÀûÀÇ ÆíÀǼºÀ» Á¦°øÇØÁÖ´Â pandas ¶óÀ̺귯¸®ÀÇ °ÅÀÇ ¸ðµç °ÍÀ» Á¤¸®ÇØ µÐ Ã¥ÀÌ´Ù. ÀÌ¹Ì 1ÆÇ¿¡¼ ´Ù¾çÇÑ ¿¹Á¦¸¦ ÅëÇØ pandas ¶óÀ̺귯¸®¸¦ »ó¼¼È÷ ¼³¸íÇßÁö¸¸, 2ÆÇ¿¡¼´Â ´õ ¸¹Àº ¿¹Á¦¸¦ ÅëÇØ Á» ´õ Ä£ÀýÇÏ°í dzºÎÇÑ ³»¿ëÀ» Àü´ÞÇÑ´Ù. ƯÈ÷ pandasÀÇ ±×·ìÈ, üÀÎ, Áý°è ÇÔ¼ö¸¦ µ¿½Ã¿¡ »ç¿ëÇÏ´Â ¹æ¹ýÀ» Á¢ÇÏ°Ô µÇ¸é ±âÁ¸ÀÇ ±î´Ù·Ó°í º¹ÀâÇÑ ¿¬»êÀ» ´Ü¼øÇÏ°Ô ±¸ÇöÇÏ´Â ÀÏÀ» ÇÒ ¼ö ÀÖÀ½¿¡ ³î¶ö °ÍÀÌ´Ù.
µ¥ÀÌÅÍ ºÐ¼®ÀÇ Á߿伺°ú µ¥ÀÌÅÍ °úÇÐÀÚÀÇ Çʿ伺¿¡ ´ëÇÑ ¸ñ¼Ò¸®´Â ÇÏ·ç°¡ ´Ù¸£°Ô Ä¿Á®°¡°í ÀÖÁö¸¸, µ¥ÀÌÅÍ ºÐ¼®¿¡¼ ¼ÒÀ§ ¡®Á¤µ·µÈ µ¥ÀÌÅÍ(Tidy data)¡¯ÀÇ Çʿ伺°ú µ¥ÀÌÅÍ Àüó¸®ÀÇ Á߿伺À» ¿©ÀüÈ÷ Àß ÀνÄÇÏÁö ¸øÇÏ´Â µíÇÏ´Ù. ƯÈ÷ ÆÄÀ̽ãÀ» ÀÌ¿ëÇØ µ¥ÀÌÅ͸¦ ºÐ¼®ÇÏ´Â ´ëºÎºÐÀÇ »ç¶÷µéÀº ´Ã pandas¸¦ »ç¿ëÇϸ鼵µ Á¤ÀÛ pandasÀÇ Àüü ±â´ÉÀ» Á¦´ë·Î ÇнÀÇÏ·Á´Â ³ë·ÂÀº ¸¹ÀÌ ºÎÁ·ÇÑ µíÇÏ´Ù. DataFrame°ú Series µî pandasÀÇ ±Ù°£ÀÌ µÇ´Â µ¥ÀÌÅÍ ±¸Á¶¿¡¼ ÀÚ½ÅÀÌ ¿øÇÏ´Â ºÎºÐ¸¸ Á¤È®È÷ ¼±ÅÃÇ쵂 °¡Àå È¿À²ÀûÀÎ ¹æ½ÄÀ¸·Î ó¸®ÇÏ´Â ¹æ¹ýÀ» dzºÎÇÑ ¿¹Á¦¸¦ ÅëÇØ ¹è¿ï ¼ö ÀÖ´Ù.
-
-
|
¸ÅÆ® Çظ®½¼ [Àú]
|
|
-
-
|
Å©¶ó½º·¦ [Àú]
|
|
-
-
-
Àüü 0°³ÀÇ ±¸¸ÅÈıⰡ ÀÖ½À´Ï´Ù.
|
ÀÎÅÍÆÄÅ©µµ¼´Â °í°´´ÔÀÇ ´Ü¼ø º¯½É¿¡ ÀÇÇÑ ±³È¯°ú ¹ÝÇ°¿¡ µå´Â ºñ¿ëÀº °í°´´ÔÀÌ ÁöºÒÄÉ µË´Ï´Ù.
´Ü, »óÇ°À̳ª ¼ºñ½º ÀÚüÀÇ ÇÏÀÚ·Î ÀÎÇÑ ±³È¯ ¹× ¹ÝÇ°Àº ¹«·á·Î ¹ÝÇ° µË´Ï´Ù. |
|
±³È¯ ¹× ¹ÝÇ°ÀÌ °¡´ÉÇÑ °æ¿ì |
»óÇ°À» °ø±Þ ¹ÞÀº ³¯·ÎºÎÅÍ 7ÀÏÀ̳» °¡´É
°ø±Þ¹ÞÀ¸½Å »óÇ°ÀÇ ³»¿ëÀÌ Ç¥½Ã, ±¤°í ³»¿ë°ú ´Ù¸£°Å³ª ´Ù¸£°Ô ÀÌÇàµÈ °æ¿ì¿¡´Â °ø±Þ¹ÞÀº ³¯·ÎºÎÅÍ 3°³¿ù À̳», ȤÀº ±×»ç½ÇÀ» ¾Ë°Ô µÈ ³¯ ¶Ç´Â ¾Ë ¼ö ÀÖ¾ú´ø ³¯·ÎºÎÅÍ 30ÀÏ À̳»
»óÇ°¿¡ ¾Æ¹«·± ÇÏÀÚ°¡ ¾ø´Â °æ¿ì ¼ÒºñÀÚÀÇ °í°´º¯½É¿¡ ÀÇÇÑ ±³È¯Àº »óÇ°ÀÇ Æ÷Àå»óÅ µîÀÌ ÀüÇô ¼Õ»óµÇÁö ¾ÊÀº °æ¿ì¿¡ ÇÑÇÏ¿© °¡´É |
|
±³È¯ ¹× ¹ÝÇ°ÀÌ ºÒ°¡´ÉÇÑ °æ¿ì |
±¸¸ÅÈ®Á¤ ÀÌÈÄ(¿ÀǸ¶ÄÏ»óÇ°¿¡ ÇÑÇÔ)
°í°´´ÔÀÇ Ã¥ÀÓ ÀÖ´Â »çÀ¯·Î »óÇ° µîÀÌ ¸ê½Ç ¶Ç´Â ÈÑ¼ÕµÈ °æ¿ì
(´Ü, »óÇ°ÀÇ ³»¿ëÀ» È®ÀÎÇϱâ À§ÇÏ¿© Æ÷Àå µîÀ» ÈѼÕÇÑ °æ¿ì´Â Á¦¿Ü)
½Ã°£ÀÌ Áö³²¿¡ µû¶ó ÀçÆǸŰ¡ °ï¶õÇÒ Á¤µµ·Î ¹°Ç°ÀÇ °¡Ä¡°¡ ¶³¾îÁø °æ¿ì
Æ÷Àå °³ºÀµÇ¾î »óÇ° °¡Ä¡°¡ ÈÑ¼ÕµÈ °æ¿ì |
|
´Ù¹è¼ÛÁöÀÇ °æ¿ì ¹ÝÇ° ȯºÒ |
´Ù¹è¼ÛÁöÀÇ °æ¿ì ´Ù¸¥ Áö¿ªÀÇ ¹ÝÇ°À» µ¿½Ã¿¡ ÁøÇàÇÒ ¼ö ¾ø½À´Ï´Ù.
1°³ Áö¿ªÀÇ ¹ÝÇ°ÀÌ ¿Ï·áµÈ ÈÄ ´Ù¸¥ Áö¿ª ¹ÝÇ°À» ÁøÇàÇÒ ¼ö ÀÖÀ¸¹Ç·Î, ÀÌÁ¡ ¾çÇØÇØ Áֽñ⠹ٶø´Ï´Ù. |
|
Áß°í»óÇ°ÀÇ ±³È¯ |
Áß°í»óÇ°Àº Á¦ÇÑµÈ Àç°í ³»¿¡¼ ÆǸŰ¡ ÀÌ·ç¾îÁö¹Ç·Î, ±³È¯Àº ºÒ°¡´ÉÇÕ´Ï´Ù. |
|
¿ÀǸ¶ÄÏ »óÇ°ÀÇ È¯ºÒ |
¿ÀǸ¶ÄÏ»óÇ°¿¡ ´ëÇÑ Ã¥ÀÓÀº ¿øÄ¢ÀûÀ¸·Î ¾÷ü¿¡°Ô ÀÖÀ¸¹Ç·Î, ±³È¯/¹ÝÇ° Á¢¼ö½Ã ¹Ýµå½Ã ÆǸÅÀÚ¿Í ÇùÀÇ ÈÄ ¹ÝÇ° Á¢¼ö¸¦ ÇϼžßÇϸç, ¹ÝÇ°Á¢¼ö ¾øÀÌ ¹Ý¼ÛÇϰųª, ¿ìÆíÀ¸·Î º¸³¾ °æ¿ì »óÇ° È®ÀÎÀÌ ¾î·Á¿ö ȯºÒÀÌ ºÒ°¡´ÉÇÒ ¼ö ÀÖÀ¸´Ï À¯ÀÇÇϽñ⠹ٶø´Ï´Ù. |
|
|
|
¹è¼Û¿¹Á¤ÀÏ ¾È³» |
ÀÎÅÍÆÄÅ© µµ¼´Â ¸ðµç »óÇ°¿¡ ´ëÇØ ¹è¼Û¿Ï·á¿¹Á¤ÀÏÀ» À¥»çÀÌÆ®¿¡ Ç¥½ÃÇÏ°í ÀÖ½À´Ï´Ù.
|
<ÀÎÅÍÆÄÅ© Á÷¹è¼Û »óÇ°> |
»óÇ°Àº ¿ù~Åä¿äÀÏ ¿ÀÀü 10½Ã ÀÌÀü ÁÖ¹®ºÐ¿¡ ´ëÇÏ¿© ´çÀÏ Ãâ°í/´çÀÏ ¹è¼Û¿Ï·á¸¦ º¸ÀåÇÏ´Â »óÇ°ÀÔ´Ï´Ù. |
»óÇ°Àº ¼¿ïÁö¿ª/ÆòÀÏ ÁÖ¹®ºÐÀº ´çÀÏ Ãâ°í/ÀÍÀÏ ¹è¼Û¿Ï·á¸¦ º¸ÀåÇϸç,
¼¿ï¿ÜÁö¿ª/ÆòÀÏ ÁÖ¹®ºÐÀÇ °æ¿ì´Â ¿ÀÈÄ 6½Ã±îÁö ÁÖ¹®ºÐ¿¡ ´ëÇÏ¿© ÀÍÀÏ ¹è¼Û¿Ï·á¸¦ º¸ÀåÇÏ´Â »óÇ°ÀÔ´Ï´Ù.
(´Ü, ¿ù¿äÀÏÀº 12½Ã±îÁö ÁÖ¹®¿¡ ÇÑÇÔ)
|
»óÇ°Àº, ÀÔ°í¿¹Á¤ÀÏ(Á¦Ç°Ãâ½ÃÀÏ)+Åùè»ç¹è¼ÛÀÏ(1ÀÏ)¿¡ ¹è¼Û¿Ï·á¸¦ º¸ÀåÇÕ´Ï´Ù. |
~
»óÇ°Àº À¯ÅëƯ¼º»ó ÀÎÅÍÆÄÅ©¿¡¼ Àç°í¸¦ º¸À¯ÇÏÁö ¾ÊÀº »óÇ°À¸·Î ÁÖ¹®ÀÏ+±âÁØÃâ°íÀÏ+Åùè»ç¹è¼ÛÀÏ(1ÀÏ)¿¡ ¹è¼Û¿Ï·á¸¦ º¸ÀåÇÕ´Ï´Ù.(Åä/°øÈÞÀÏÀº ¹è¼Û±â°£¿¡ Æ÷ÇÔµÇÁö ¾Ê½À´Ï´Ù.)
¡Ø±âÁØÃâ°íÀÏ:ÀÎÅÍÆÄÅ©°¡ »óÇ°À» ¼ö±ÞÇÏ¿© ¹°·ùâ°í¿¡¼ Æ÷Àå/Ãâ°íÇϱâ±îÁö ¼Ò¿äµÇ´Â ½Ã°£
|
|
<¾÷ü Á÷Á¢¹è¼Û/¿ÀǸ¶ÄÏ »óÇ°> |
~
»óÇ°Àº ¾÷ü°¡ ÁÖ¹®À» È®ÀÎÇÏ°í, Ãâ°íÇϱâ±îÁö °É¸®´Â ½Ã°£ÀÔ´Ï´Ù. ÁÖ¹®ÀÏ+±âÁØÃâ°íÀÏ+Åùè»ç¹è¼ÛÀÏ(2ÀÏ)¿¡ ¹è¼Û¿Ï·á¸¦ º¸ÀåÇÕ´Ï´Ù.(Åä/°øÈÞÀÏÀº ¹è¼Û±â°£¿¡ Æ÷ÇÔµÇÁö ¾Ê½À´Ï´Ù.)
¡Ø5ÀÏÀ̳» Ãâ°í°¡ ½ÃÀÛµÇÁö ¾ÊÀ»½Ã, ¿ÀǸ¶ÄÏ »óÇ°Àº ÀÚµ¿À¸·Î ÁÖ¹®ÀÌ Ãë¼ÒµÇ¸ç, °í°´´Ô²² Ç°Àýº¸»ó±ÝÀ» Áö±ÞÇØ µå¸³´Ï´Ù.
|
|
|
¹è¼Ûºñ ¾È³» |
µµ¼(Áß°íµµ¼ Æ÷ÇÔ)¸¸ ±¸¸ÅÇϽøé : ¹è¼Ûºñ 2,000¿ø (1¸¸¿øÀÌ»ó ±¸¸Å ½Ã ¹«·á¹è¼Û) À½¹Ý/DVD¸¸ ±¸¸ÅÇϽøé : ¹è¼Ûºñ 1,500¿ø (2¸¸¿øÀÌ»ó ±¸¸Å ½Ã ¹«·á¹è¼Û)
ÀâÁö/¸¸È/±âÇÁÆ®¸¸ ±¸¸ÅÇϽøé : ¹è¼Ûºñ 2,000¿ø (2¸¸¿øÀÌ»ó ±¸¸Å ½Ã ¹«·á¹è¼Û)
µµ¼¿Í À½¹Ý/DVD¸¦ ÇÔ²² ±¸¸ÅÇϽøé : ¹è¼Ûºñ 1,500¿ø 1¸¸¿øÀÌ»ó ±¸¸Å ½Ã ¹«·á¹è¼Û)
µµ¼¿Í ÀâÁö/¸¸È/±âÇÁÆ®/Áß°íÁ÷¹è¼Û»óÇ°À» ÇÔ²² ±¸¸ÅÇϽøé : 2,000¿ø (1¸¸¿øÀÌ»ó ±¸¸Å ½Ã ¹«·á¹è¼Û)
¾÷üÁ÷Á¢¹è¼Û»óÇ°À» ±¸¸Å½Ã : ¾÷üº°·Î »óÀÌÇÑ ¹è¼Ûºñ Àû¿ë
* ¼¼Æ®»óÇ°ÀÇ °æ¿ì ºÎºÐÃë¼Ò ½Ã Ãß°¡ ¹è¼Ûºñ°¡ ºÎ°úµÉ ¼ö ÀÖ½À´Ï´Ù.
* ºÏÄ«Æ®¿¡¼ ¹è¼Ûºñ¾ø¾Ö±â ¹öÆ°À» Ŭ¸¯Çϼż, µ¿ÀϾ÷ü»óÇ°À» Á¶±Ý ´õ ±¸¸ÅÇϽøé, ¹è¼Ûºñ¸¦ Àý¾àÇÏ½Ç ¼ö ÀÖ½À´Ï´Ù.
|
|
Çؿܹè¼Û ¾È³» |
ÀÎÅÍÆÄÅ©µµ¼¿¡¼´Â ±¹³»¿¡¼ ÁÖ¹®ÇϽðųª ÇØ¿Ü¿¡¼ ÁÖ¹®ÇÏ¿© ÇØ¿Ü·Î ¹è¼ÛÀ» ¿øÇÏ½Ç °æ¿ì DHL°ú Ư¾àÀ¸·Î Ã¥Á¤µÈ ¿ä±ÝÇ¥¿¡
ÀÇÇØ °³ÀÎÀÌ ÀÌ¿ëÇÏ´Â °æ¿ìº¸´Ù ¹è¼Û¿ä±ÝÀ» Å©°Ô ³·Ã߸ç DHL(www.dhl.co.kr)·Î Çؿܹè¼Û ¼ºñ½º¸¦ Á¦°øÇÕ´Ï´Ù.
Çؿܹè¼ÛÀº µµ¼/CD/DVD »óÇ°¿¡ ÇÑÇØ ¼ºñ½ºÇÏ°í ÀÖÀ¸¸ç, ´Ù¸¥ »óÇ°À» ºÏÄ«Æ®¿¡ ÇÔ²² ´ãÀ¸½Ç °æ¿ì Çؿܹè¼ÛÀÌ ºÒ°¡ÇÕ´Ï´Ù.
ÇØ¿ÜÁÖ¹®¹è¼Û ¼ºñ½º´Â ÀÎÅÍÆÄÅ© µµ¼ ȸ¿ø °¡ÀÔÀ» Çϼž߸¸ ½Åû °¡´ÉÇÕ´Ï´Ù. |
|
¾Ë¾ÆµÎ¼¼¿ä!!! |
µµ¸Å»ó ¹× Á¦ÀÛ»ç »çÁ¤¿¡ µû¶ó Ç°Àý/ÀýÆÇ µîÀÇ »çÀ¯·Î Ãë¼ÒµÉ ¼ö ÀÖ½À´Ï´Ù.
¿ÀǸ¶ÄϾ÷üÀÇ ¹è¼ÛÁö¿¬½Ã ÁÖ¹®ÀÌ ÀÚµ¿À¸·Î Ãë¼ÒµÉ ¼ö ÀÖ½À´Ï´Ù.
Ãâ°í°¡´É ½Ã°£ÀÌ ¼·Î ´Ù¸¥ »óÇ°À» ÇÔ²² ÁÖ¹®ÇÒ °æ¿ì Ãâ°í°¡´É ½Ã°£ÀÌ °¡Àå ±ä ±âÁØÀ¸·Î ¹è¼ÛµË´Ï´Ù.
À¯ÅëÀÇ Æ¯¼º»ó Ãâ°í±â°£Àº ¿¹Á¤º¸´Ù ¾Õ´ç°ÜÁö°Å³ª ´ÊÃçÁú ¼ö ÀÖ½À´Ï´Ù.
Åùè»ç ¹è¼ÛÀÏÀÎ ¼¿ï ¹× ¼öµµ±ÇÀº 1~2ÀÏ, Áö¹æÀº 2~3ÀÏ, µµ¼, »ê°£, ±ººÎ´ë´Â 3ÀÏ ÀÌ»óÀÇ ½Ã°£ÀÌ ¼Ò¿äµË´Ï´Ù. |
|
|
|
|