본문 바로가기

분류 전체보기162

Pandas Data concat / merge / join pandas에서 데이터 프레임을 병합하는 방법 pd.concat() pd.merge() pd.join() # 딕셔너리 안에 데이터 형태 만들기 left = pd.DataFrame({ "key" : ["K0", "K4", "K2", "K3"], "A" :["A0", "A1", "A2", "A3"], "B" : ["B0", "B1", "B2", "B3"] }) left # 리스트 안에 딕셔너리 형태로 데이터 만들기 right = pd.DataFrame([ {"key":"K0", "C":"C0", "D": "D0"}, {"key":"K1", "C":"C1", "D": "D1"}, {"key":"K2", "C":"C2", "D": "D2"}, {"key":"K3", "C":"C3", "D": "D3"} ]) r.. 2022. 11. 9.
Pandas Basic pandas에서 가장 많이 사용되는 데이터형은 dataFrame * DataFrame()에서 괄호 안에 커서 넣고 shift + tab 누르면 해당 입력어에 대한 설명, 예제 나온다. index와 columns를 지정하면 된다. jupyter notebook에서 # 하나 쓰고 esc 누르고 m 누르면 제목 작업 됨. ##, ### 크기 차이. 작성하고 shift + enter 셀에서 esc 눌러서 초록색 창 된 상태에서 a 누르면 상위에 창 하나 생성됨. ✔️ .head() : 앞부분 5개 조회 .tail() : 뒷부분 5개 조회 .index : dataFrame의 index 확인 .columns : dataFrame의 columns 확인 .values : dataFrame의 value 확인 .info(.. 2022. 11. 8.
[Error] Jupyter notebook / code 실행 오류 왜 .. 안열려요..? 도저히 모르겠어서 구글링 + 검색 해보니 터미널에 명령어 입력해주면 가능하다는 해결방법을 보았지만 내 경우 되지 않았다. \ 한참을 머리 굴리다가 찾은 방법 ! 원인과 해결방법 참고 벨로그 https://velog.io/@ji_o_ni/Mac-OS-아나콘다-Jupyter-Notebook-Lunch-경로-에러-해결하기 https://acdongpgm.tistory.com/120 TIL 03 | Mac OS 아나콘다 Jupyter Notebook Lunch 경로 에러 해결하기 코드를 한 줄씩 작성 및 실행하여 결과 확인 가능하고, 문서처럼 코드를 작성하여 정리해 볼 수 있는 유용한 툴인 Juptyter Notebook 활용하고자 아나콘다를 설치했다. 아나콘다는 파이썬 컴파일러 velo.. 2022. 11. 7.
[Jupiter notebook] read_csv 💡잘 모르겠을 때, 구글에 pandas read_excel documentation 검색. pandas에 상세 설명 O ✔️구글링 서울시 자치도 연도별 cctv 설치 현황 검색. 서울시 열린데이터 광장 -> 오픈 API 서비스 -> 서울시 구별 인구통계(엑셀파일 저장) ✔️Pandas로 CSV, 엑셀 읽기 import pandas as pd CCTV_Seoul = pd.read_csv("../data/Seoul_CCTV.csv") pop_Seoul = pd.read_excel("../data/Seoul_Population.xls") ✔️ 한글 깨져서 나올 때 CCTV_Seoul = pd.read_csv("../data/Seoul_CCTV.csv", encoding="utf-8")한글은 encoding설정.. 2022. 11. 7.
[Python] Colab 주요 기능, 한글 폰트 https://colab.research.google.com/ Google Colaboratory colab.research.google.com 주요 기능 ✔️런타임 모두 실행 : 긴 노트의 코드를 한번에 실행하는 명령 실행 중단 : 어떤 이유든 응답이 없거나, 긴 시간 실행중인 경우 코드를 중단하는 명령 런타임 다시 시작 : 메모리에 저장된 변수나 실행 결과를 모두 초기화하고 다시 코드를 진행 런타임 초기화 : 업로드한 파일, 모듈, 변수 등 모두 삭제 초기화 ✔️도구 -> 명령 팔레트 -> "출력" 검색 -> 모든 출력 지우기 선택 : 코드 실행 출력값만 삭제. command + shift + p ✔️ 한글 사용시에 가장 초반에 언어 재입력 ✔️ 마크다운 편집창 ✔️!ls : 현재 경로에 있는 파일 .. 2022. 11. 7.
[Python] conda 환경 💡terminal -> conda activate ds_study 항상 입력해서 가상환경 활성화 시켜주고 시작하기 -> code 입력해서 visual studio code 실행 -> command + shift + p -> python interpreter -> conda ds_study 기본환경으로 빠져나오기 conda deactivate 어떠한 콘다 환경 있는지 목록 확인 conda env list 콘다 환경 삭제 conda env remove -n ds_study 활성화 됐다면 visual studio code 실행했을때 하단. 2022. 11. 7.
[Python] Jupyter notebook_matplotlib 한글 설정 ✔️한글 적용 코드 -> 매번 실행. import matplotlib.pyplot as plt from matplotlib import rc %matplotlib inline rc('font', family = 'Arial Unicode Ms') plt.title("데이터사이언스"); from matplotlib import font_manager f_path = "/Library/Fonts/Arial Unicode.ttf" font_manager.FontProperties(fname=f_path).get_name() 'Arial Unicode MS' 2022. 11. 5.
데이터의 기초 통계량_ 키워드 / 수식 ✔️ 기초 통계량 = 기술 통계량 통계량 = 표본으로 산출한 값. 통계량을 통해 데이터가 갖는 특성 이해 가능 ✔️ 중심 경향치 표본의 중심을 설명하는 대표값. 평균, 중앙값, 최빈값, 절사 평균 모짐단으로부터 관측된 n개의 x가 주어졌을 때, 표본 평균은 (sample mean, ✔️ 중앙값(median) 관측치를 크기순으로 나열했을 때, 가운데 위치하는 값. 홀수개 -> 가운데 하나 / 짝수개 -> 가운데 값 2개의 평균 -> 이상치가 포함된 데이터에 대해 사용. ✔️ 최빈값(mode) 관측치에서 가장 많이 관측되는 값 -> 옷사이즈와 같이 명목형 데이터의 경우 사용 ✔️ 산포도 데이터가 어떻게 흩어져 있는지 확인하기 위해 중심경향치와 함께 산포에 대한 측도 고려해야함. 데이터의 산포도 나타내는 측도.. 2022. 11. 4.
01. 선형검색 01. 선형 검색 - 나열되어 있는 데이터를 앞에서부터 순차적으로 스캔해서 searchNum 찾는다. if n == len(datas) -> n이 하나씩 커지면서 datas를 다 스캔했는데도 맞는 정보가 없다. 보초법 -> 마지막 인덱스에 찾으려는 값을 추가해서 찾는 과정을 간략화한다. 검색 성공과 실패는 마지막 인덱스 이전에 searchNum의 유무로 판별된다. - 선형 검색 연습문제 2022. 10. 29.