도구들/R,파이썬

[파이썬] 대용량 텍스트 파일(txt) 에서 원하는 정보 추출하기

cactus 2022. 4. 12. 20:46

https://ryuhyun.tistory.com/64

 

건축행정데이터(세움터) - 전국 건축물대장 표제부 다운받고 확인하기

세움터는 국토교통부 녹색건축과의 건축행정시스템으로, 건축인허가 현황과 건축물대장 자료를 제공하고 있다. 건축데이터 민간개방 시스템에서 월 단위로 대용량 원시데이터를 제공한다. 건

ryuhyun.tistory.com

건축데이터 민간개방 시스템에서 다운받은 전국 표제부 데이터가 2기가가 넘는 관계로.. 메모장에서 열리지 않는다.

하지만 여기서 특정 조건에 해당하는 표제부 정보를 추출하고자 할 때 파이썬을 활용할 수 있다.

나는 전국 표제부 데이터에서 서울시의 표제부 정보만을 추출하고자 한다.

 

파이썬에 원본 txt 파일을 'r' 로 불러오고, (f 변수로 불러옴)

결과 파일을 저장할 txt 를 'w' 로 지정한다. (output 변수로 저장함)

f=open('mart_djy_03.txt','r')
output=open('output.txt','w')

원본 텍스트 파일에서 '서울특별시' 가 있는 라인을 output 에 저장하겠다.

만약 '서울특별시' 가 줄에 있다면, 해당 줄을 output에 write 하는 것이다.

for line in f:
    if '서울특별시' in line:
        output.write(line)
output.close()

코드 실행 후, '서울특별시' 가 있는 줄들만 output.txt 에 저장된 것을 확인한다.

 

반응형