ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • [Data Science] ๋ฐ์ดํ„ฐ ์‚ฌ์ด์–ธ์Šค์— ์‚ฌ์šฉ๋˜๋Š” ํŒŒ์ด์ฌ ํŒจํ‚ค์ง€ ์ •๋ฆฌ(numpy, matplotlib, pandas)
    ๐Ÿ’ปProgramming/Data Science 2024. 9. 28. 04:40

    Numpy

    ์ˆ˜์น˜์ ์ธ ์—ฐ์‚ฐ์— ์ตœ์ ํ™”๋œ ํŒŒ์ด์ฌ ๋„๊ตฌ์ด๋‹ค. 

    ๊ฐœ๋ฐœ์ž๋Š” ํŒŒ์ด์ฌ ๋ฌธ๋ฒ•์„ ์ด์šฉํ•ด ์‚ฌ์šฉํ•˜์ง€๋งŒ ๋‚ด๋ถ€์ ์œผ๋กœ๋Š” C์–ธ์–ด๋กœ ์—„์ฒญ๋‚œ ์ตœ์ ํ™”๊ฐ€ ๋˜์–ด์žˆ์–ด ๋” ํšจ์œจ์ ์ธ ๋ฉ”๋ชจ๋ฆฌ ๊ด€๋ฆฌ์™€

    ๋” ํšจ์œจ์ ์ธ ์—ฐ์‚ฐ์ด ๊ฐ€๋Šฅํ•˜๋„๋ก ์•Œ๊ณ ๋ฆฌ์ฆ˜ ์„ค๊ณ„๊ฐ€ ๋˜์–ด์žˆ๋‹ค. ๋˜ํ•œ ์ปดํ“จํ„ฐ ํ•˜๋“œ์›จ์–ด๋ฅผ ํšจ์œจ์ ์œผ๋กœ ํ™œ์šฉํ•œ๋‹ค๋Š” ์žฅ์ ์ด ์žˆ๋‹ค. 

    ์˜ˆ๋ฅผ ๋“ค์–ด, ํ•œ๊ตญ์˜ ๋…„๋„๋ณ„ gdp๊ฐ€ ๋‹ฌ๋Ÿฌ๋กœ ํ‘œํ˜„๋œ ๋ฐฐ์—ด์„ ์›ํ™”๋กœ ํ™˜์‚ฐํ•˜๊ณ ์‹ถ๋‹ค๋ฉด,

     

    Python๋งŒ ์ด์šฉ

    for i in range(len(gdp_korea_array)):
        gdp_korea_array[i] = gdp_korea_array[i] * 1335
    gdp_korea_array

     

    ํŒŒ์ด์ฌ์—์„œ๋Š” ๋ฐฐ์—ด ์•ˆ์˜ ๋ชจ๋“  ์š”์†Œ์— ๊ณฑํ•˜๊ธฐ๋ฅผ ํ•˜๊ณ  ์‹ถ์„ ๋•Œ ์ด๋ ‡๊ฒŒ for๋ฌธ์„ ์‚ฌ์šฉํ•ด์„œ ํ•˜๋‚˜ํ•˜๋‚˜ ๋„ฃ์–ด์ฃผ์–ด์•ผ ํ•˜์ง€๋งŒ,

    numpy ์ด์šฉ

    gdp_korea_array * 1335

    numpy๋ฅผ ์‚ฌ์šฉํ•˜๋ฉด ์ด ํ•œ์ค„๋กœ ํ•ด๊ฒฐ์ด๋œ๋‹ค. (์‹ฌ์ง€์–ด ์†๋„๋„ ๋” ๋น ๋ฅด๋‹ค.)


    Matplotlib

    ์šฐ๋ฆฌ๊ฐ€ ๊ฐ€์ง„ ๋ฐ์ดํ„ฐ๋ฅผ "์‹œ๊ฐํ™”"ํ•˜๋Š”๋ฐ ์ค‘์ ์„ ๋‘” ํŒจํ‚ค์ง€์ด๋‹ค.

    ๋งŒ์•ฝ์— ๋ฐฐ์—ด์„ numpy๋กœ ํ‘œํ˜„ํ•œ๋‹ค๊ณ  ํ–ˆ์„ ๋•Œ, 

    numpy

     

    ๋ณ„๋กœ ์ง๊ด€์ ์œผ๋กœ ์™€๋‹ฟ์ง€ ์•Š๋Š”๋‹ค. ํ•˜์ง€๋งŒ maplotlib์„ ์‚ฌ์šฉํ•œ๋‹ค๋ฉด,

    matplotlib

    ์ด๋ ‡๊ฒŒ ํ›จ์”ฌ๋” ์ง๊ด€์ ์œผ๋กœ ํ‘œํ˜„์ด ๊ฐ€๋Šฅํ•˜๋‹ค.


    pandas

    ์šฐ๋ฆฌ๋Š” ๋ฐ์ดํ„ฐ ์‚ฌ์ด์–ธ์Šค๋ฅผ ํ•  ๋•Œ, ์—ฌ๋Ÿฌ ์ˆซ์ž๋“ค์„ ํ‘œ๋กœ ์ •๋ฆฌํ•˜๋Š” ๊ฒƒ์ด ํ•„์ˆ˜์ ์ธ๋ฐ, numpy๋งŒ ์ด์šฉํ•ด์„œ๋Š” ์ง๊ด€์ ์œผ๋กœ ์—ฌ๋Ÿฌ ๋ณ€์ˆ˜๋“ค ์‚ฌ์ด์˜ ์ƒ๊ด€๊ด€๊ณ„๋ฅผ ์•Œ์•„๋‚ด๊ธฐ ์–ด๋ ต๋‹ค.

    ๋˜ํ•œ, numpy๋ฅผ ์‚ฌ์šฉํ•ด ๋ฐฐ์—ด์„ ํ‘œํ˜„ํ•˜๋ฉด ํ•œ ํƒ€์ž…๋งŒ ๋ฐฐ์—ด์— ๋„ฃ์„ ์ˆ˜ ์žˆ๊ธฐ ๋•Œ๋ฌธ์— ๋ฐฐ์—ด์•ˆ์˜ ์š”์†Œ์— ์ˆซ์ž๊ฐ’๊ณผ ๋ฌธ์ž๊ฐ’์„ ๋™์‹œ์— ๋„ฃ๊ณ  ์‹ถ๋”๋ผ๋„ ํ•œ๊ฐ€์ง€ ํƒ€์ž…๋งŒ ์‚ฌ์šฉํ•ด์•ผํ•œ๋‹ค๋Š” ์น˜๋ช…์ ์ธ ๋‹จ์ ์ด ์กด์žฌํ•œ๋‹ค. ๋”ฐ๋ผ์„œ numpy ๋ฐฐ์—ด์˜ ๋‹จ์ ์„ ์ •๋ฆฌํ•˜์ž๋ฉด, 

    numpy array์˜ ๋‹จ์ 

    • ๊ฐ€๋…์„ฑ์ด ๋–จ์–ด์ง
    • ์š”์†Œ๋“ค์— ๋Œ€ํ•œ ๋ ˆ์ด๋ธ” ์‚ฝ์ž…์ด ๋ถˆ๊ฐ€ -> ์ง๊ด€์ ์ด์ง€ ๋ชปํ•จ
    • ํ•œ ๊ฐ€์ง€ ๋ฐ์ดํ„ฐ ํƒ€์ž…๋งŒ ์‚ฌ์šฉ ๊ฐ€๋Šฅ

    ์ด๋ ‡๊ฒŒ ํ•ด์„œ ๋‚˜์˜จ ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ๊ฐ€ "pandas"์ด๋‹ค. 

    pandas๋Š” numpy๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ํ•ด์„œ ๋‚˜์˜จ ๋Œ€ํ‘œ์ ์ธ ๋ฐ์ดํ„ฐ ๋ถ„์„ ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ์ด๋‹ค. 

    pandas๋ฅผ ์ด์šฉํ•œ๋‹ค๋ฉด,

    • ๋ฐ์ดํ„ฐ ๋ถˆ๋Ÿฌ์˜ค๊ธฐ
    • ๋ฐ์ดํ„ฐ ๊ฐ€๊ณต
    • ๋ฐ์ดํ„ฐ ๋ถ„์„
    • ๋ฐ์ดํ„ฐ ์‹œ๊ฐํ™”

    ๊ฐ€ ๊ฐ€๋Šฅํ•˜๋‹ค. 

     

    Numpy = ๋ณต์žกํ•œ ์ˆ˜ํ•™ ์—ฐ์‚ฐ์„ ํ•  ๋•Œ

    Pandas = "ํ‘œ ํ˜•ํƒœ"์˜ ๋ฐ์ดํ„ฐ๋ฅผ ๊ฐ„ํŽธํ•˜๊ฒŒ ๋‹ค๋ฃจ๊ณ  ์‹ถ์„ ๋•Œ

     

    ์‚ฌ์šฉํ•œ๋‹ค๊ณ  ์ •๋ฆฌ๊ฐ€ ๊ฐ€๋Šฅํ•˜๋‹ค. 

    pandas ์‚ฌ์šฉ ์˜ˆ์‹œ

Designed by Tistory.