파이썬 크롤러) pandas로 데이터를 엑셀로 저장할 때 추가 데이터를 이어 업데이트하기 !

파일을 한 번 저장하고,

그 파일 위에 추가적으로 다른 데이터를 또 이어서 저장하는 경우,

import pandas as pd
#names 리스트와 links 리스트는 각각 요소를 포함하는 리스트로 정의되어 있음을 전제로 함
data={"names":name, "links":link}
db=pd.DataFrame(data, columns=["names", "links"])

db.to_csv('DB.csv', mode='a', header=False, index=True)

mode='a'를 쓰면 이어쓰기 가능하다.

names 리스트와 links 리스트가 업데이트 되어 DB.csv파일을 업데이트 하는 경우,

저장할 때 header와 index를 정의해주지 않으면 데이터만 업데이트 되는게 아니라

header와 index가 중복되어 이어 써진다.

나의 경우, index는 계속 업데이트 되길 바랬고 header (이 경우에는 name 과 link라는 셀 맨 위의 각 열 제목)는 삭제 되길 바래서

저렇게 썼음

저작자표시 비영리 동일조건

'Python notes > Others' 카테고리의 다른 글

파이썬 크롤러) 크롤링(스크랩핑) 중간에 pause, 쉬는 시간을 두려면? (time.sleep 사용) (0)	2019.01.04
파이썬 크롤러) 파이썬, 리스트 안의 리스트를 풀어서 하나의 리스트로 만들기 (이중 리스트 일자화) (0)	2019.01.04
파이썬 크롤러) 파이썬 코딩을 위해 pip로 pandas 등 모듈을 깔 때 주의점 ! (0)	2018.12.17
파이썬 크롤러) string 문자열 편집하기 (양 옆 자르기, 특정 문자 변경하기) (0)	2018.12.13
파이썬 크롤러) 데이터 파싱 후 쓸데없는 태그 지우기 (re.sub, 태그 제거) (0)	2018.12.13

울창한 데이터 숲

파이썬 크롤러) pandas로 데이터를 엑셀로 저장할 때 추가 데이터를 이어 업데이트하기 !

'Python notes > Others' 카테고리의 다른 글

댓글

티스토리툴바

파이썬 크롤러) pandas로 데이터를 엑셀로 저장할 때 추가 데이터를 이어 업데이트하기 !

'Python notes > Others' 카테고리의 다른 글

관련글

댓글

티스토리툴바