Excel에서 차이를 계산하는 방법

따라서 Excel(Excel) 을 사용하여 분산을 계산하라는 요청을 받았지만 이것이 의미하는 바 또는 수행 방법을 잘 모릅니다. 걱정하지 마세요. 쉬운 개념이고 훨씬 더 쉬운 과정입니다. 당신은 곧 분산 전문가가 될 것입니다!

분산이란 무엇입니까?

" 분산(Variance) "은 평균으로부터의 평균 거리를 측정하는 방법입니다. "평균"은 데이터 세트의 모든 값의 합을 값의 수로 나눈 값입니다. 분산(Variance) 은 해당 데이터 세트의 값이 평균적으로 평균에 균일하게 고정되는 경향이 있는지 또는 전체에 분산되는 경향이 있는지에 대한 아이디어를 제공합니다.

수학적으로 분산은 그렇게 복잡하지 않습니다.

  1. 값 집합의 평균을 계산합니다. 평균을 계산하려면 모든 값의 합을 값의 수로 나눈 값을 취하십시오.
  2. 세트의 모든 값을 가져 와서 평균에서 빼십시오.
  3. 결과 값을 제곱(Square) 합니다(음수를 취소하기 위해).
  4. 모든 제곱(Add) 값을 더합니다.
  5. 제곱 값의 평균을 계산하여 분산을 구합니다.

보시다시피 계산하기 어려운 값이 아닙니다. 그러나 수백 또는 수천 개의 값이 있는 경우 수동으로 수행하는 데 시간이 오래 걸립니다. 따라서 Excel(Excel) 이 프로세스를 자동화할 수 있다는 것은 좋은 일입니다 !

당신은 무엇을 위해 Variance를 사용합니까?

Variance는 그 자체로 많은 용도를 가지고 있습니다. 순전히 통계적 관점에서 보면 데이터 집합이 얼마나 분산되어 있는지 표현하는 좋은 약식 방법입니다. 투자자는 분산을 사용하여 주어진 투자의 위험을 추정합니다.

예를 들어, 일정 기간 동안의 주식 가치(stock’s value) 를 취하고 그 분산을 계산하면 과거의 변동성을 잘 알 수 있습니다. 과거가 미래를 예측한다는 가정하에 분산이 낮은 것이 더 안전하고 예측 가능하다는 것을 의미합니다.

다른 기간에 걸쳐 무언가의 분산을 비교할 수도 있습니다. 이것은 또 다른 숨겨진 요소가 무언가에 영향을 미치고 분산을 변경하는 시기를 감지하는 데 도움이 될 수 있습니다.

분산은 표준 편차로 알려진 다른 통계량과도 밀접한 관련이 있습니다. 분산을 계산하는 데 사용되는 값은 제곱임을 기억하십시오 . (Remember)이는 분산이 원래 값의 동일한 단위로 표현되지 않음을 의미합니다. 표준 편차는 값을 원래 단위로 되돌리기 위해 분산의 제곱근을 취해야 합니다. 따라서 데이터가 킬로그램 단위인 경우 표준 편차도 마찬가지입니다.

모집단(Between Population)표본 분산 중에서(Sample Variance) 선택하기

Excel 에는 수식이 약간 다른 두 가지 하위 유형이 있습니다 . 어떤 것을(Which one) 선택해야 하는지는 데이터에 따라 다릅니다. 데이터에 전체 "인구"가 포함된 경우 모집단 분산을 사용해야 합니다. 이 경우 "인구"는 대상 인구 그룹의 모든 구성원에 대한 모든 값이 있음을 의미합니다. 

예를 들어, 왼손잡이 사람들의 체중을 보고 있다면 인구에는 왼손잡이인 지구상의 모든 개인이 포함됩니다. 모두 무게를 측정했다면 모집단 분산을 사용합니다. 

물론 실생활에서 우리는 일반적으로 더 큰 모집단에서 더 작은 표본에 만족합니다. 이 경우 표본 분산을 사용합니다. 모집단(Population) 분산은 더 작은 모집단에서 여전히 실용적입니다. 예를 들어 회사에는 각 직원에 대한 데이터가 있는 직원이 수십만 또는 수천 명일 수 있습니다. 그들은 통계적 의미에서 "인구"를 나타냅니다.

올바른 분산 공식 선택

Excel에는 세 가지 표본 분산 공식과 세 가지 모집단 분산 공식이 있습니다.

  • (VAR)표본 분산에 대한 VAR , VAR.SVARA .
  • (VARP)모집단 분산에 대한 VARP , VAR.PVARPA .

VARVARP 는 무시할 수 있습니다 . 이것들은 구식이며 레거시 스프레드시트와의 호환성을 위해서만 사용됩니다.

그러면 숫자 값 집합의 분산을 계산하기 위한 VAR.SVAR.P 와 텍스트 문자열을 포함하는 VARAVARPA 가 남습니다.(VARPA)

VARAVARPA 는 "TRUE" 및 "FALSE"를 제외한 모든 텍스트 문자열을 숫자 값 0으로 변환합니다. 이들은 각각 1과 0으로 변환됩니다.

가장 큰 차이점은 VAR.SVAR.P 가 숫자가 아닌 값을 건너뛴다는 것입니다. 이렇게 하면 총 값 수에서 해당 케이스가 제외됩니다. 즉, 평균을 얻기 위해 더 적은 수의 케이스로 나누어야 하기 때문에 평균 값이 달라집니다.

Excel에서 차이를 계산하는 방법

Excel 에서 분산을 계산하는 데 필요한 것은 값 집합뿐입니다. 아래 예에서는 VAR.S 를 사용 하지만 공식과 방법은 사용하는 분산 공식에 관계없이 정확히 동일합니다.

  1. 범위 또는 불연속 값 집합이 준비되어 있다고 가정하고 원하는 빈 셀(empty cell) 을 선택합니다.

  1. 수식 필드에 =VAR.S(XX:YY) 를 입력 합니다. 여기서 X 및 Y 값은 범위의 첫 번째 및 마지막 셀 번호로 바뀝니다.

  1. Enter 키(Enter) 를 눌러 계산을 완료합니다.

또는 특정 값을 지정할 수 있습니다. 이 경우 수식은 =VAR.S(1,2,3,4) 와 같습니다 . 숫자가 분산을 계산하는 데 필요한 것으로 대체되었습니다. 이와 같이 수동으로 최대 254개의 값을 입력할 수 있지만 소수의 값만 있는 경우가 아니면 셀 범위에 데이터를 입력한 다음 위에서 설명한 수식의 셀 범위 버전을 사용하는 것이 거의 항상 더 좋습니다.

당신은 Excel에서 Excel을 할 수 있습니다, Er, Excel

분산 계산은 Excel(Excel) 에서 통계 작업을 수행해야 하는 모든 사용자에게 유용한 트릭입니다 . 그러나 이 기사에서 사용한 Excel 용어가 혼란스럽다면 Microsoft Excel 기본 자습서 - Excel 사용 방법 학습 을(Microsoft Excel Basics Tutorial – Learning How to Use Excel) 확인하는 것이 좋습니다.

반면에 더 많은 준비가 되었다면 Excel 산점도에 선형 회귀 추세선 추가(Add a Linear Regression Trendline to an Excel Scatter Plot) 를 확인 하여 산술 평균과 관련하여 데이터 세트의 분산 또는 기타 측면을 시각화할 수 있습니다.



About the author

저는 소프트웨어 리뷰어이자 생산성 전문가입니다. Excel, Outlook 및 Photoshop과 같은 다양한 소프트웨어 응용 프로그램에 대한 소프트웨어 리뷰를 검토하고 작성합니다. 내 리뷰는 충분한 정보를 제공하며 애플리케이션 품질에 대한 객관적인 통찰력을 제공합니다. 2007년부터 소프트웨어 리뷰를 작성해 왔습니다.



Related posts