본문 바로가기

Python notes118

MySQL) Workbench에서 테이블 행(row) 개수 세는 법 (+특정 데이터 개수 세기) MySQL workbench에서 테이블은 행(row)과 열(column)으로 되어 있는데,행으로 채워진 데이터의 개수를 알고 싶다면? select count(*) from 테이블이름; 위 문장을 치고, 번개 모양 execute 버튼을 누르면 몇개인지 Result Grid에 나옴 그리고 특정 데이터의 개수를 세고 싶을 때는?id 혹은 다른 column의 값을 사용해서 셀 수 있음. select count(*) from 테이블이름 where id>1,000; #id가 1,000이상인 데이터들(row)의 개수를 세는 법select count(*) from 테이블이름 where 칼럼이름='과일'; #칼럼이름이 '과일'로 작성되어 있는 데이터들의 개수를 세는 법 2019. 1. 13.
파이썬 크롤러) 파이썬으로 MySQL에 한종류의 DB만 보내는 법 (한 Column 데이터만 삽입) id와 link라는 2개의 column으로만 만들어진 테이블에link에만 데이터를 쫙 넣으려고 하는데... 계속 에러가 ㅠ Traceback (most recent call last): File "", line 2, in File "/Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages/mysql/connector/cursor_cext.py", line 248, in execute prepared = self._cnx.prepare_for_mysql(params) File "/Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages/mysql.. 2019. 1. 7.
파이썬 크롤러) 리스트에서 홀수번째 혹은 짝수번째 요소만 추출하기 #1. 리스트에서 요소를 추출하는 방법 일반적으로 리스트에서 요소를 추출하려면 인덱스 번호를 활용한다. 예를 들어 a_list=['one','two','three','four','five']라는 리스트가 있을 때 a_list[0]과 같이 리스트 명을 쓰고 [ ] 괄호 안에 인덱스 번호를 적어 print(a_list[0])을 실행하면 해당 인덱스 번호에 해당하는 'one'이라는 원소가 출력이 된다. 참고로 파이썬에서 리스트의 인덱스 번호는 0부터 시작한다. 슬라이싱이라는 기법으로 몇번째부터 몇번째까지의 원소를 출력할 수도 있다. a_list[0:2]와 같이 인덱스 번호 대신 "0 콜론 2"를 [ ] 괄호 안에 입력할 경우, 0번째부터 2번째 전까지의 원소들을 출력해 준다. 즉 'one', 'two'가 출력.. 2019. 1. 6.
파이썬 크롤러) 크롤링(스크랩핑) 중간에 pause, 쉬는 시간을 두려면? (time.sleep 사용) 신나게 크롤링 하다 보면...쉬지 않고 크롤링하는 데이터 양이 많다 보면...특정 사이트에서 IP 차단 당하는 경우가 있다. 한동안 해당 사이트에 접속이 불가능해진다. (서버에 부하가 걸릴 수 있기 때문에 이런 활동을 차단하도록 웹서비스를 설계) 이런 상황을 막기 위해 할 수 있는 여러가지 방법 중, 웹서버에 부하가 걸리지 않도록또한, 나의 크롤러가 차단당하지 않도록중간에 쉬는 시간을 좀 두면 차단을 막을 수 있다고 한다. (나도 이제 해봐야 됨.. 어제는 한번 차단 당했음..) 몇초를 얼마나 해야 되는지 감이 오지 않아 여러번 해봐야겠지만, 여튼 !! import timetime.sleep(5) 위에 꺼는 5초 쉬는거..5초를 쉬어야 할지 10초를 쉬어야 할지는 해봐야 알겠다. 2019. 1. 4.
파이썬 크롤러) 파이썬, 리스트 안의 리스트를 풀어서 하나의 리스트로 만들기 (이중 리스트 일자화) 리스트 안의 리스트를 풀어서 중첩되지 않은 하나의 리스트로 만들 때 간단한 방법: biglist=sum(biglist, []) 예를 들어, biglist=[1, 2, [3, 4,]] 의 형식일 때, [1, 2, 3, 4]로 만들고 싶다면 위의 명령어를 쓰면 된다. 2019. 1. 4.