Python notes/Others
파이썬 크롤러) pandas로 데이터를 엑셀로 저장할 때 추가 데이터를 이어 업데이트하기 !
성실한 나무
2018. 12. 20. 16:56
파일을 한 번 저장하고,
그 파일 위에 추가적으로 다른 데이터를 또 이어서 저장하는 경우,
import pandas as pd
#names 리스트와 links 리스트는 각각 요소를 포함하는 리스트로 정의되어 있음을 전제로 함
data={"names":name, "links":link}
db=pd.DataFrame(data, columns=["names", "links"])
db.to_csv('DB.csv', mode='a', header=False, index=True)
mode='a'를 쓰면 이어쓰기 가능하다.
names 리스트와 links 리스트가 업데이트 되어 DB.csv파일을 업데이트 하는 경우,
저장할 때 header와 index를 정의해주지 않으면 데이터만 업데이트 되는게 아니라
header와 index가 중복되어 이어 써진다.
나의 경우, index는 계속 업데이트 되길 바랬고 header (이 경우에는 name 과 link라는 셀 맨 위의 각 열 제목)는 삭제 되길 바래서
저렇게 썼음