파일을 한 번 저장하고,
그 파일 위에 추가적으로 다른 데이터를 또 이어서 저장하는 경우,
import pandas as pd
#names 리스트와 links 리스트는 각각 요소를 포함하는 리스트로 정의되어 있음을 전제로 함
data={"names":name, "links":link}
db=pd.DataFrame(data, columns=["names", "links"])
db.to_csv('DB.csv', mode='a', header=False, index=True)
mode='a'를 쓰면 이어쓰기 가능하다.
names 리스트와 links 리스트가 업데이트 되어 DB.csv파일을 업데이트 하는 경우,
저장할 때 header와 index를 정의해주지 않으면 데이터만 업데이트 되는게 아니라
header와 index가 중복되어 이어 써진다.
나의 경우, index는 계속 업데이트 되길 바랬고 header (이 경우에는 name 과 link라는 셀 맨 위의 각 열 제목)는 삭제 되길 바래서
저렇게 썼음
'Python notes > Others' 카테고리의 다른 글
파이썬 크롤러) 크롤링(스크랩핑) 중간에 pause, 쉬는 시간을 두려면? (time.sleep 사용) (0) | 2019.01.04 |
---|---|
파이썬 크롤러) 파이썬, 리스트 안의 리스트를 풀어서 하나의 리스트로 만들기 (이중 리스트 일자화) (0) | 2019.01.04 |
파이썬 크롤러) 파이썬 코딩을 위해 pip로 pandas 등 모듈을 깔 때 주의점 ! (0) | 2018.12.17 |
파이썬 크롤러) string 문자열 편집하기 (양 옆 자르기, 특정 문자 변경하기) (0) | 2018.12.13 |
파이썬 크롤러) 데이터 파싱 후 쓸데없는 태그 지우기 (re.sub, 태그 제거) (0) | 2018.12.13 |
댓글