● install
● import
```
from bs4 import BeautifulSoup
```
● open
```
page = open("../data/-", "r").read()
soup=BeautifulSoup(page, "html.parser")
print(soup.prettify())
```
prettify() 써줄 시 , 들여쓰기 된 상태의 가독성 좋은 html로 불러와줌
● tag 확인
```
# head 태그 확인
soup.head
# body 태그 확인
soup.body
# p 태그 확인 / 가장 처음에 입력된 p 태그만 확인 가능
soup.p
soup.find("p")
# p 태그 안의 속성값 찾기(class_는 파이썬 기본 예약어 class랑 차이 만들어주려 입력)
soup.find("p", class_= "inner-text first-item")
# p 태그 안의 정보 찾기(test로 문자값만 반환 / strip으로 공백 지워서 원하는 데이터만 남김)
soup.find("p", {"class" : "outer-text first-item"}).text.strip()
# 다중 조건. id=first 조건 포함 검색
soup.find("p", {"class":"inner-text first-item", "id":"first"})
# find_all(). 괄호 안 태그의 모든 내용 반환. list 형태.
soup.find_all("p")
# 특정 태그 확인
soup.find_all(id="pw-link")[0].text
```
● text Method
```
print(soup.find_all("p")[0].text)
print(soup.find_all("p")[1].string)
print(soup.find_all("p")[1].get_text())
```
● a 태그에서 href 속성값에 있는 값 추출
```
links = soup.find_all("a")
links[0].get("href")
links[1]["href"]
```
둘 다 추출값 같음
'Data Analysis' 카테고리의 다른 글
예제 3-2. 시카고 맛집 하위페이지 데이터 분석 + 지도 시각화 (0) | 2022.11.23 |
---|---|
예제 3-1. 시카고 맛집 메인페이지 데이터 분석 (0) | 2022.11.21 |
예제 2. 위키백과 문서 정보 가져오기 (0) | 2022.11.20 |
예제1-2 네이버금융 (0) | 2022.11.18 |
예제1-1. 네이버 금융 (0) | 2022.11.17 |