Python notes/Others

R) is.na()와 ==NA의 차이

성실한 나무 2021. 5. 17. 12:09

#1. is.na(a)

a 객체 안에 NA 값이 있으면 그 자리에 TRUE를 반환하고, 없으면 FALSE를 반환한다.

 

#2. a==NA

a가 NA와 동일한지 확인을 하려고 비교연산자 ==를 사용하면

무조건 NA가 return된다.

a가 여러가지 값을 가진 벡터이면 그 값들의 개수만큼 NA NA NA...가 나열된다.

반응형

 

심지어 b에 NA를 할당한 후에 확인해도 마찬가지로 결과는 NA.

TRUE나 FALSE로 논리적인 계산을 하지 않는다.

 

 

#3. NA가 들어 있으면 평균값도 마찬가지로 NA

mean(a) 함수를 쓰면 a객체 값에 대한 평균을 내주는데, a가 NA를 포함하고 있으면 그 결과 값이 NA가 나온다.

 

 

#4. 결론

일단 데이터에 Not Available한 값이 있으면 모든 연산의 결과를 NA로 한 이유는,

해당값을 정제한 후 데이터 분석을 하라는 의도가 아닐까 생각해본다.