분류 전체보기162 AttributeError: module 'tabula' has no attribute 'read_pdf' ERROR 원인 : 노트북에 java가 깔려있지 않아서 발생한 충돌이다. java install을 완료한 뒤 tabula install, 정상작동 되는지 확인해준다. 2022. 12. 29. [ML] Machine Learning Machine Learning : 인공지능의 한 분야로, 컴퓨터가 학습할 수 있도록 하는 알고리즘과 기술을 개발하는 분야이다. 컴퓨터가 학습 모형을 기반으로 주어진 데이터를 통해 스스로 학습하는 것을 뜻한다. - 머신러닝은 Task, Experience, Performance의 세가지 요소를 가지고 있다. Task를 달성하기 위해 경험을 통해 성능을 개선시킨다. 즉, 1)분석하고자 하는 목표(T)를 정의. 2)Experience를 정의하기 위한 데이터를 수집. 3)Performance를 향상시키기 위한 Measure를 정의하는 것을 의미한다. 01. Supervised Learning : Label이 있는 데이터에 대해서 분석하는 방법으로 과거의 데이터로 미래를 예측하는 방법이다. Classificati.. 2022. 12. 28. [ML] Scikit Learn Scikit Learn : 현재 파이썬에서 가장 유명한 기계 학습 오픈 소스 라이브러리 from sklearn.tree import DecisionTreeClassifier iris_tree = DecisionTreeClassifier() iris_tree.fit(iris.data[:, 2:], iris.target) iris정보 파일이 존재하는 상태에서, iris_tree에 정보를 학습시키는 간단한 코드이다. fit( )은 학습하라는 의미가 담겼다. 뒷부분에는 학습시키고자 하는 정보를 입력해주어야 한다. from sklearn.metrics import accuracy_score y_pred_tr = iris_tree.predict(iris.data[:, 2:]) metrics 모듈에서 accuracy.. 2022. 12. 28. [ML] Decision Tree system을 계획 · 추진해 갈 때 효용 및 가치 판단에 의해 결정이 이루어지는데, 그 결정을 추진하는 데 또 각종 방안이 생각되고, 그 하나의 방안을 결정함으로써 다음의 각종 문제가 생긴다. 또, 그 결정에 의한 결과의 예상도 필요하다. 이들을 마치 나무의 가지와 같이 도시한 것으로, 결정의 트리라고도 한다. 이에 의하면 논리의 진전이 명백해지고, 또 결정에 의한 방안의 비교를 할 수 있어 시스템추진에 매우 유효하다. 정보 획득 Information Gain : 정보의 가치를 반환하는데 발생하는 사전의 확률이 작을수록 정보의 가치는 커진다. 정보 이득 : 어떤 속성을 선택함으로 인해서 데이터를 더 잘 구분하게 되는 것이다. 엔트로피 개념 : 열역학의 용어로 물질의 열적 상태를 나타내는 물리량의 단위 .. 2022. 12. 28. [Tableau] Quick Table _ 비율차이 / YoY성장률 / 백분위수 / 이동평균 01. 비율 차이 : 측정값들 사이에 퍼센트 차이 / 성장률 02. YoY 성장률 (전년대비 성장률) : 같은 월에서 이전년도와 비교 03. 백분위수 04. 이동평균 해당 분기 이전으로 5개의 분기의 평균값을 구한 라인이다. 위 시트로 이동평균선 밑으로 내려오는 분기들은 실적을 내지 못했음을 파악 가능하다. 2022. 12. 28. [Tableau] Quick Table _ 누계 / 차이 / 구성비율 / 순위 목표 : 월별 매출과 누적 매출을 함께 보는 화면을 만든다. 01. 누계 행 - 매출 / 연 - option키 누르고 주문일자 드래그하여 연속형 월 표시되게 한다. 행에 매출 테이블 하나를 추가하여 이중차트를 만들고, 하단 표에서는 누계를 보기 위해 퀵테이블 -> 누계 선택해준다. 주황색이 누계 선이다. 위의 시트는 나누어졌던 두 시트를 이중축 선택하여 하나의 시트로 합쳐준 것이다. 02. 차이 : 계산 기준을 이전 / 다음 / 첫번째 / 지난 기준으로 설정하여 차이값을 구할 수 있다. 행 - 매출 / 열 - 주문일자 option키 누르고 드래그하여 연속형 분기로 넣어준 뒤, 라인으로 표시된 그래프를 막대형으로 바꿔준다. 매출 -> 퀵 테이블 계산 -> 차이 전 분기 대비 매출 차이를 볼 수 있는 막대 .. 2022. 12. 28. [Tableau] Story Sheet1 - 서울시 연간 성장률 행에 매출, 열에 주문일자(년) / 색상에 주문일자 / 레이블에 매출(매출액과 전년대비성장률) / 필터에 시도를 넣어 서울시만 확인하게 한다. Sheet2 - 분기별 성장률 분기를 보고자 함이기 때문에 열- 분기 주문일자를 년 앞으로 빼준다. 분기별로 연도별 성장률을 한패널에 묶어주게된다. 분기를 좀 더 강조하기 위해 분기 머릿글 부분에서 마우스 우클릭 -> 서식 -> 글자 색상/크기 변경한다. 레이블의 매출은 빼주었다. Sheet3 - 제품 대분류 열 - 분기 주문일자를 제거하고 제품 대분류를 끼워넣는다. Sheet4 - 제품 중분류 사무기기만 확인하기 위해 해당 항목만 유지시킨다. 매출 레이블에 다시 넣어준 뒤, 매출차이를 보고싶기에 퀵테이블 계산 -> 차이 / 계.. 2022. 12. 28. [Tableau] Dashboard_ layout 마크 레이블에 매출을 넣어준 뒤 글자 크기와 색상을 조정해준다. 서식에서 행 구분선 또한 생성해준다. 필터에 주문일자와 시도 (모든 항목 선택)을 넣어준 뒤, 워크시트 적용 -> 관련 데이터 모든항목 선택 시트 한개는 완성됐다. 이를 복제하고 마크에 있는 매출만 수익으로 바꾼 뒤 시트2를 완성했다. 위 시트를 복제하고 제품 대분류 / 중분류를 행에, 매출을 열에 넣고 마크의 수익을 색상으로 지정하여 시트3을 완성해주었다. 대시보드 레이아웃을 정리해준다. 일단 개체 -> 세로칸 하나 삽입 -> 맨 위 구분을 위해 텍스트 추가 -> 가로칸 삽입 가로칸을 삽입할 때에 주의할 점은 , 해당 대시보드 안에 점선이 나타날때에 삽입해야한다는 것이다. 그래야 확실하게 들어간다. 첫번째 가로칸에 텍스트 박스를 넣어 제목.. 2022. 12. 27. [Tableau] Dashboard_ 동작(url) / 개체 01. 동작(url) 지역명이 들어가 있는 시트를 하나 만들어준다. 다음 대시보드를 만드는데, 해당 시트를 넣어놓은 뒤 왼쪽 하단의 개체 -> 웹페이지를 대시보드 하단으로 넣어준다.그럼 url편집창이 뜬다. 키워드를 넣으면 네이버에서 검색이 되는 동작을 만들고 싶기에, 인터넷창을 열어 해당 주소값을 확인해보았다. https://search.naver.com/search.naver?where=nexearch&sm=top_hty&fbm=1&ie=utf8&query=강원 강원을 검색해보았을때 마지막 query값이 강원인 것을 확인했고, 키워드는 때에 따라 달라지기에 '강원'을 뺀 query= 까지의 값을 url로 넣어주었다. 대시보드 -> 동작 -> URL 동작 추가 -> 웹 페이지 개체, 하단에 url 입력.. 2022. 12. 27. 이전 1 ··· 6 7 8 9 10 11 12 ··· 18 다음