from bs4 import BeautifulSoup
뷰티풀수프 import 했을 뿐인데.. 아래처럼 전에 안 나오던 에러가 뜬다.
module 'html5lib.treebuilders' has no attribute '_base'
_html5lib.py 파일에서 에러가 나는 것으로 보이는데..
예전에 한번 이 에러로 인해서 _html5lib.py 파일 내에 있는 모든 "base" 를 "_base" 로 변경한 기억이 있는데 소용 없었나 보다.
구글링 해보니, bs4를 업그레이드 해보라고 해서
cmd 창을 켜고 아래와 같이 입력했다.
pip install --upgrade beautifulsoup4
이렇게 입력하니 업그레이드가 진행되고, beautifulsoup4-4.11.1 버전으로 업그레이드 되었다.
업그레이드 후 다시 import 하니 에러 없이 성공적으로 진행되었는데,
스크립트 폴더의 _html5lib.py 파일을 확인해보니 해당 부분이 업데이트가 된 것으로 보인다.
py 파일을 우클릭하고 edit with IDLE 로 스크립트를 확인해 보니,
첫 줄에 # Use of this source code is governed by the MIT license. 라는 메모 이하로
밑으로 내려가 보면 treebuilders에서 _base, base 를 import 하는 부분이 업데이트 되어 있다.
위의 에러가 발생한다면 bs4를 업그레이드 하고 html5lib.py 파일이 수정된 부분을 확인해 보시면 될 것 같다.
반응형
'도구들 > R,파이썬' 카테고리의 다른 글
[파이썬] 판다스 csv 불러올때 인코딩 에러('utf-8' codec can't decode ) (0) | 2022.05.13 |
---|---|
[파이썬] 뷰티풀수프bs4 - html 태그 삭제하기(.decompose()) (0) | 2022.04.25 |
[파이썬] 대용량 텍스트 파일(txt) 에서 원하는 정보 추출하기 (0) | 2022.04.12 |
[파이썬] 텍스트 파일(txt) 읽고 쓰기(readline) (0) | 2022.04.12 |
[파이썬] 웹사이트 주소 수집하기(url 크롤링) 1. html에서 url 찾아서 파이썬으로 가져오기 (1) | 2022.03.26 |