제품명들을 string으로 묶고나서
필요 없는 텍스트들을 삭제하고 부호들을 다른 것으로 교체해 보았다.
prd_names=str(soup.find_all('td', class_='ProdName'))
prd_names=prd_names[1:-1] #string 양 옆으로 수정
prd_names=prd_names.replace('&', '&') #'&'로 적힌 부분을 '&'으로 변경
prd_names=prd_names.replace(', ', ',') #쉼표 뒤의 공백을 없애려고 ', '를 ','로 변경
prd_names[1:-1]의 의미는 앞에서 두번째 글자부터 뒤에서 두번째 글자까지만 나타낸다는 뜻.
예를 들어 prd_names="삥안녕하세요뿡" 일 경우 맨 앞과 맨 뒤의 삥과 뿡을 뺄 수 있음.
replace('삭제할 글자', '삭제한 것을 대체할 새로운 글자') 이렇게 작성하게 되는데,
예를 들어 prd_names="삥안녕하세요뿡" 일 경우,
prd_names=prd_names.replace("삥", "") 라고 한 후 prd_names를 print해 보면 "안녕하세요뿡"으로 나올 것이다.
이어서 prd_names=prd_names.replace("뿡", "!")라고 한 후 prd_names를 print해 보면 "안녕하세요!"로 나온다.
'Python notes > Others' 카테고리의 다른 글
파이썬 크롤러) pandas로 데이터를 엑셀로 저장할 때 추가 데이터를 이어 업데이트하기 ! (0) | 2018.12.20 |
---|---|
파이썬 크롤러) 파이썬 코딩을 위해 pip로 pandas 등 모듈을 깔 때 주의점 ! (0) | 2018.12.17 |
파이썬 크롤러) 데이터 파싱 후 쓸데없는 태그 지우기 (re.sub, 태그 제거) (0) | 2018.12.13 |
파이썬 크롤러) 파이썬에서 Selenium으로 자동 로그인 하기 (xpath 사용법) (1) | 2018.12.07 |
번외) pip버전 업그레이드하기 (pip version upgrade, upgrade pip) (1) | 2018.11.13 |
댓글