Python notes/Others

파이썬 크롤러) pandas로 데이터를 엑셀로 저장할 때 추가 데이터를 이어 업데이트하기 !

성실한 나무 2018. 12. 20. 16:56

파일을 한 번 저장하고,

그 파일 위에 추가적으로 다른 데이터를 또 이어서 저장하는 경우, 

 

import pandas as pd
#names 리스트와 links 리스트는 각각 요소를 포함하는 리스트로 정의되어 있음을 전제로 함
data={"names":name, "links":link}
db=pd.DataFrame(data, columns=["names", "links"])
db.to_csv('DB.csv', mode='a', header=False, index=True)

 

mode='a'를 쓰면 이어쓰기 가능하다.

 

names 리스트와 links 리스트가 업데이트 되어 DB.csv파일을 업데이트 하는 경우,

저장할 때 header와 index를 정의해주지 않으면 데이터만 업데이트 되는게 아니라

header와 index가 중복되어 이어 써진다.

 

나의 경우, index는 계속 업데이트 되길 바랬고 header (이 경우에는 name 과 link라는 셀 맨 위의 각 열 제목)는 삭제 되길 바래서

저렇게 썼음