Python 6

[파이썬] 현재 폴더 확인(os.getcwd), 폴더 변경(os.chdir), 폴더내 파일 목록 출력(os.listdir)

일단 먼저 'import os' 로 os 모듈을 불러온다. import os 1. 현재 위치를 확인하는 명령어는 os.getcwd() 2. 폴더를 변경하는 명령어는 os.chdir() : CMD 명령 프롬프트와 마찬가지로 상위 폴더로 이동할 때는 ../ 상위의 다른 폴더로 이동할 때는 ../(폴더명) 하위 폴더로 이동할 때는 /(폴더명) 3. 폴더 내 파일 목록을 확인하는 명령어는 os.listdir() D드라이브로 변경하는 방법은 아래. https://ryuhyun.tistory.com/87 사용자 > (사용자 이름) " 폴더로 지정되어 있다. 상위 폴더로 이동하는게 불가능하기 때문에, D드라이브 등 하" data-og-host="ryuhyun.tistory.com" data-og-source-url=..

[파이썬] 파이썬 연결자 콤마(,)와 더하기(플러스)(+)의 차이

파이썬 코드를 작성하다 보면, 콤마와 +가 각각 다른 상황에 쓰인다. 정확한 차이를 이해하기 위해 정리해 보려고 한다. 위의 예시에서 보면 a, b 문자열을 콤마로 연결했을 때는 띄어쓰기 되지만, 플러스로 연결했을 때는 붙여서 출력된다. 1, 2 를 콤마로 연결하면 1, 2 각자의 값이 출력되지만, 플러스로 연결하면 합산하여 출력된다. 즉, 콤마로 연결한 값들은, 각 값들 개별로 전달된다. 플러스로 연결한 값들은, 합산하여 하나의 값으로 전달된다. 문자(str)과 숫자(int) 를 혼합하여 연결해 보자. '올해는 2022년 입니다' 문장을 아래처럼 나눠서 연결하려고 한다. '올해는', '년 입니다' 는 문자(str), 2022 는 숫자(int) 이다. 콤마로 연결한 경우 각 값이 개별 값으로 전달되어 출..

[파이썬] 판다스 csv 불러올때 인코딩 에러('utf-8' codec can't decode )

csv 파일을 파이썬 판다스로 불러오려고 아래와 같이 입력하였다. df=pd.read_csv('경로/파일명.csv') df 그랬더니 아래와 같이 에러 메시지가 출력되었다. UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc1 in position 48: invalid start byte utf-8 관련인 것으로 보아 인코딩 문제인 것으로 보인다. 다른 한글 인코딩 방식인 'cp949', 'euc-kr' 등 인코딩 방식을 지정해보자. 나는 'cp949' 를 선택했다. df=pd.read_csv('경로/파일명.csv',encoding='CP949') df 한글 인코딩 옵션 추가 후, 에러 없이 정상적으로 출력되는 것을 확인했다.

[파이썬] module 'html5lib.treebuilders' has no attribute '_base' 에러 해결

from bs4 import BeautifulSoup 뷰티풀수프 import 했을 뿐인데.. 아래처럼 전에 안 나오던 에러가 뜬다. module 'html5lib.treebuilders' has no attribute '_base' _html5lib.py 파일에서 에러가 나는 것으로 보이는데.. 예전에 한번 이 에러로 인해서 _html5lib.py 파일 내에 있는 모든 "base" 를 "_base" 로 변경한 기억이 있는데 소용 없었나 보다. 구글링 해보니, bs4를 업그레이드 해보라고 해서 cmd 창을 켜고 아래와 같이 입력했다. pip install --upgrade beautifulsoup4 이렇게 입력하니 업그레이드가 진행되고, beautifulsoup4-4.11.1 버전으로 업그레이드 되었다. ..

[파이썬] 대용량 텍스트 파일(txt) 에서 원하는 정보 추출하기

https://ryuhyun.tistory.com/64 건축행정데이터(세움터) - 전국 건축물대장 표제부 다운받고 확인하기 세움터는 국토교통부 녹색건축과의 건축행정시스템으로, 건축인허가 현황과 건축물대장 자료를 제공하고 있다. 건축데이터 민간개방 시스템에서 월 단위로 대용량 원시데이터를 제공한다. 건 ryuhyun.tistory.com 건축데이터 민간개방 시스템에서 다운받은 전국 표제부 데이터가 2기가가 넘는 관계로.. 메모장에서 열리지 않는다. 하지만 여기서 특정 조건에 해당하는 표제부 정보를 추출하고자 할 때 파이썬을 활용할 수 있다. 나는 전국 표제부 데이터에서 서울시의 표제부 정보만을 추출하고자 한다. 파이썬에 원본 txt 파일을 'r' 로 불러오고, (f 변수로 불러옴) 결과 파일을 저장할 tx..

[파이썬] 텍스트 파일(txt) 읽고 쓰기(readline)

텍스트 파일이 대용량이거나 해서 메모장에서 열리지 않는 경우가 있다. 그럴 때 파일 내용의 일부를 파이썬에서 확인해보는 방법이 있다. 파이썬에서 텍스트 파일을 읽으려면 일단 먼저 open 을 이용해서 파일을 연다. 건축물 표제부 데이터를 "sample.txt" 라는 파일로 임의로 저장했고, 이 파일을 f 변수에 저장해서 열어보려고 한다. 파일을 읽을 때는 'r' 을 인자로 추가한다. f=open('sample.txt','r') 파일이 읽어진 것을 주피터 노트북 내에서 확인할 때는 readline, readlines 를 활용할 수 있다. readline은 첫 줄만 읽고, readllines는 모든 줄을 읽는다. 아래와 같이 입력해서 f 변수에서 라인을 읽어낸다. f.readline() 텍스트 파일에 쓸 때..

반응형