๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ
Python

[Jupiter notebook] read_csv

by ram_ 2022. 11. 7.

๐Ÿ’ก์ž˜ ๋ชจ๋ฅด๊ฒ ์„ ๋•Œ, ๊ตฌ๊ธ€์— pandas read_excel documentation ๊ฒ€์ƒ‰. pandas์— ์ƒ์„ธ ์„ค๋ช… O

 

โœ”๏ธ๊ตฌ๊ธ€๋ง

์„œ์šธ์‹œ ์ž์น˜๋„ ์—ฐ๋„๋ณ„ cctv ์„ค์น˜ ํ˜„ํ™ฉ ๊ฒ€์ƒ‰. 

์„œ์šธ์‹œ ์—ด๋ฆฐ๋ฐ์ดํ„ฐ ๊ด‘์žฅ -> ์˜คํ”ˆ API ์„œ๋น„์Šค -> ์„œ์šธ์‹œ ๊ตฌ๋ณ„ ์ธ๊ตฌํ†ต๊ณ„(์—‘์…€ํŒŒ์ผ ์ €์žฅ)

 

โœ”๏ธPandas๋กœ CSV, ์—‘์…€ ์ฝ๊ธฐ

import pandas as pd

CCTV_Seoul = pd.read_csv("../data/Seoul_CCTV.csv")

pop_Seoul = pd.read_excel("../data/Seoul_Population.xls")

 

โœ”๏ธ ํ•œ๊ธ€ ๊นจ์ ธ์„œ ๋‚˜์˜ฌ ๋•Œ

CCTV_Seoul = pd.read_csv("../data/Seoul_CCTV.csv", encoding="utf-8")ํ•œ๊ธ€์€ encoding์„ค์ • ํ•„์ˆ˜.

 

โœ”๏ธ

.head() -> ์ž๋ฃŒ๊ฐ€ ๊ธธ ๊ฒฝ์šฐ ์ƒ์œ„ 5๊ฐœ๋งŒ ์ถœ๋ ฅ

.tail() : ํ•˜์œ„ 5๊ฐœ ์ •๋ณด ์ถœ๋ ฅ

.columns -> ์ปฌ๋Ÿผ ์ด๋ฆ„ ์กฐํšŒ ๊ฐ€๋Šฅ

.rename(inplace=True). -> inplace=True ์ ์–ด์ค˜์•ผ ๋ฐ”๋€ ๋ฐ์ดํ„ฐ๊ฐ’ ๋ฐ”๋กœ ์ €์žฅ๋จ.

ex) CCTV_Seoul.rename(columns={CCTV_Seoul.columns[0]: "๋ฐ”๊พธ๊ณ  ์‹ถ์€ ๋‹จ์–ด"}, inplace=True)

pd.read_csv() -> ๊ด„ํ˜ธ ์•ˆ ๋ฐ์ดํ„ฐ ์œ„์น˜ ์‚ฝ์ž…ํ•˜์—ฌ ์ฝ๊ธฐ ๊ฐ€๋Šฅ

 

โœ”๏ธ๋ชจ๋“ˆ ๋„ค์ด๋ฐ ๊ทœ์น™

import MODULE -> MODULE.function

import MODULE as md -> md.function

from MODULE import function -> function

 

โœ”๏ธ์—‘์…€ ํŒŒ์ผ์— ์นผ๋Ÿผ ์—ฌ๋Ÿฌpart๋กœ ๋‚˜๋‰˜์–ด์ ธ ์žˆ์„๋•Œ pandas๋กœ ๋ถˆ๋Ÿฌ์˜ค๋ฉด ๋ณด๊ธฐ ์•ˆ์ข‹๊ฒŒ ๋œฐ ์ˆ˜๊ฐ€ ์žˆ๋Š”๋ฐ ์ •๋ฆฌ ๋ฐฉ๋ฒ•.

header=2                 : ์ž๋ฃŒ๋ฅผ ์ฝ๊ธฐ ์‹œ์ž‘ํ•  ํ–‰ ์ง€์ •.

usecols = ""            : ์ฝ์–ด์˜ฌ ์—‘์…€์˜ ์นผ๋Ÿผ ์ง€์ •. (์Œ๋”ฐ์›€ํ‘œ ์•ˆ์˜ ๊ฐ’์„ ์ง€์ •ํ•˜์—ฌ ์ฝ์–ด์™€๋ผ.  

ex)pop_Seoul = pd.read_excel("../data/Seoul_Population.xls",header=2, usecols="B, D, G, J, N")

 

'Python' ์นดํ…Œ๊ณ ๋ฆฌ์˜ ๋‹ค๋ฅธ ๊ธ€

Pandas Data concat / merge / join  (0) 2022.11.09
Pandas Basic  (0) 2022.11.08
[Python] Colab ์ฃผ์š” ๊ธฐ๋Šฅ, ํ•œ๊ธ€ ํฐํŠธ  (0) 2022.11.07
[Python] conda ํ™˜๊ฒฝ  (0) 2022.11.07
[Python] Jupyter notebook_matplotlib ํ•œ๊ธ€ ์„ค์ •  (0) 2022.11.05