#1. is.na(a)
a 객체 안에 NA 값이 있으면 그 자리에 TRUE를 반환하고, 없으면 FALSE를 반환한다.
#2. a==NA
a가 NA와 동일한지 확인을 하려고 비교연산자 ==를 사용하면
무조건 NA가 return된다.
a가 여러가지 값을 가진 벡터이면 그 값들의 개수만큼 NA NA NA...가 나열된다.
반응형
심지어 b에 NA를 할당한 후에 확인해도 마찬가지로 결과는 NA.
TRUE나 FALSE로 논리적인 계산을 하지 않는다.
#3. NA가 들어 있으면 평균값도 마찬가지로 NA
mean(a) 함수를 쓰면 a객체 값에 대한 평균을 내주는데, a가 NA를 포함하고 있으면 그 결과 값이 NA가 나온다.
#4. 결론
일단 데이터에 Not Available한 값이 있으면 모든 연산의 결과를 NA로 한 이유는,
해당값을 정제한 후 데이터 분석을 하라는 의도가 아닐까 생각해본다.
'Python notes > Others' 카테고리의 다른 글
JupyterLabs) Ipynb파일을 실행가능한 파일로 변환하기 (+확장자 변경, excutable 하게 바꾸기) (4) | 2021.05.24 |
---|---|
R) seq() 함수로 숫자 배열 벡터 만들기 (+ seq(1,5), 1:5) (0) | 2021.05.18 |
MySQL) 윈도우 설치 시 에러 2 (+ 서비스가 제어함수에 응답하지 않습니다, msg2186) (0) | 2021.05.01 |
MySQL) 윈도우에 프로그램 설치 시 에러 1탄 (+ MSVCP140.dll이(가) 없어 코드 실행을 진행할 수 없습니다) (2) | 2021.05.01 |
MySQL) 데이터 정렬 및 집계 조회 하기(+order by, count, avg, sum, max/min, group by, having절) (0) | 2021.04.27 |
댓글