도구들/R,파이썬

[파이썬] module 'html5lib.treebuilders' has no attribute '_base' 에러 해결

cactus 2022. 4. 25. 22:15
from bs4 import BeautifulSoup

뷰티풀수프 import 했을 뿐인데.. 아래처럼 전에 안 나오던 에러가 뜬다.

 

module 'html5lib.treebuilders' has no attribute '_base'  

 

_html5lib.py 파일에서 에러가 나는 것으로 보이는데..

예전에 한번 이 에러로 인해서 _html5lib.py 파일 내에 있는 모든 "base" 를 "_base" 로 변경한 기억이 있는데 소용 없었나 보다.

 

구글링 해보니, bs4를 업그레이드 해보라고 해서

cmd 창을 켜고 아래와 같이 입력했다.

pip install --upgrade beautifulsoup4

이렇게 입력하니 업그레이드가 진행되고, beautifulsoup4-4.11.1 버전으로 업그레이드 되었다.

업그레이드 후 다시 import 하니 에러 없이 성공적으로 진행되었는데,

스크립트 폴더의 _html5lib.py 파일을 확인해보니 해당 부분이 업데이트가 된 것으로 보인다.

 

py 파일을 우클릭하고 edit with IDLE 로 스크립트를 확인해 보니,

첫 줄에 # Use of this source code is governed by the MIT license. 라는 메모 이하로 

밑으로 내려가 보면 treebuilders에서 _base, base 를 import 하는 부분이 업데이트 되어 있다.

 

위의 에러가 발생한다면 bs4를 업그레이드 하고 html5lib.py 파일이 수정된 부분을 확인해 보시면 될 것 같다.

반응형