본문 바로가기
Python notes/Others

파이썬 크롤러) string 문자열 편집하기 (양 옆 자르기, 특정 문자 변경하기)

by 성실한 나무 2018. 12. 13.

제품명들을 string으로 묶고나서

필요 없는 텍스트들을 삭제하고 부호들을 다른 것으로 교체해 보았다.


prd_names=str(soup.find_all('td', class_='ProdName'))
prd_names=prd_names[1:-1] #string 양 옆으로 수정
prd_names=prd_names.replace('&', '&') #'&'로 적힌 부분을 '&'으로 변경
prd_names=prd_names.replace(', ', ',') #쉼표 뒤의 공백을 없애려고 ', '를 ','로 변경


prd_names[1:-1]의 의미는 앞에서 두번째 글자부터 뒤에서 두번째 글자까지만 나타낸다는 뜻.

예를 들어 prd_names="삥안녕하세요뿡" 일 경우 맨 앞과 맨 뒤의 삥과 뿡을 뺄 수 있음.


replace('삭제할 글자', '삭제한 것을 대체할 새로운 글자') 이렇게 작성하게 되는데,

예를 들어 prd_names="삥안녕하세요뿡" 일 경우,

prd_names=prd_names.replace("삥", "") 라고 한 후 prd_names를 print해 보면 "안녕하세요뿡"으로 나올 것이다.


이어서 prd_names=prd_names.replace("뿡", "!")라고 한 후 prd_names를 print해 보면 "안녕하세요!"로 나온다.

댓글