Python notes/Others
R) is.na()와 ==NA의 차이
성실한 나무
2021. 5. 17. 12:09
#1. is.na(a)
a 객체 안에 NA 값이 있으면 그 자리에 TRUE를 반환하고, 없으면 FALSE를 반환한다.
#2. a==NA
a가 NA와 동일한지 확인을 하려고 비교연산자 ==를 사용하면
무조건 NA가 return된다.
a가 여러가지 값을 가진 벡터이면 그 값들의 개수만큼 NA NA NA...가 나열된다.
반응형
심지어 b에 NA를 할당한 후에 확인해도 마찬가지로 결과는 NA.
TRUE나 FALSE로 논리적인 계산을 하지 않는다.
#3. NA가 들어 있으면 평균값도 마찬가지로 NA
mean(a) 함수를 쓰면 a객체 값에 대한 평균을 내주는데, a가 NA를 포함하고 있으면 그 결과 값이 NA가 나온다.
#4. 결론
일단 데이터에 Not Available한 값이 있으면 모든 연산의 결과를 NA로 한 이유는,
해당값을 정제한 후 데이터 분석을 하라는 의도가 아닐까 생각해본다.