따라서 Excel(Excel) 을 사용하여 분산을 계산하라는 요청을 받았지만 이것이 의미하는 바 또는 수행 방법을 잘 모릅니다. 걱정하지 마세요. 쉬운 개념이고 훨씬 더 쉬운 과정입니다. 당신은 곧 분산 전문가가 될 것입니다!
분산이란 무엇입니까?
" 분산(Variance) "은 평균으로부터의 평균 거리를 측정하는 방법입니다. "평균"은 데이터 세트의 모든 값의 합을 값의 수로 나눈 값입니다. 분산(Variance) 은 해당 데이터 세트의 값이 평균적으로 평균에 균일하게 고정되는 경향이 있는지 또는 전체에 분산되는 경향이 있는지에 대한 아이디어를 제공합니다.
수학적으로 분산은 그렇게 복잡하지 않습니다.
- 값 집합의 평균을 계산합니다. 평균을 계산하려면 모든 값의 합을 값의 수로 나눈 값을 취하십시오.
- 세트의 모든 값을 가져 와서 평균에서 빼십시오.
- 결과 값을 제곱(Square) 합니다(음수를 취소하기 위해).
- 모든 제곱(Add) 값을 더합니다.
- 제곱 값의 평균을 계산하여 분산을 구합니다.
보시다시피 계산하기 어려운 값이 아닙니다. 그러나 수백 또는 수천 개의 값이 있는 경우 수동으로 수행하는 데 시간이 오래 걸립니다. 따라서 Excel(Excel) 이 프로세스를 자동화할 수 있다는 것은 좋은 일입니다 !
당신은 무엇을 위해 Variance를 사용합니까?
Variance는 그 자체로 많은 용도를 가지고 있습니다. 순전히 통계적 관점에서 보면 데이터 집합이 얼마나 분산되어 있는지 표현하는 좋은 약식 방법입니다. 투자자는 분산을 사용하여 주어진 투자의 위험을 추정합니다.
예를 들어, 일정 기간 동안의 주식 가치(stock’s value) 를 취하고 그 분산을 계산하면 과거의 변동성을 잘 알 수 있습니다. 과거가 미래를 예측한다는 가정하에 분산이 낮은 것이 더 안전하고 예측 가능하다는 것을 의미합니다.
다른 기간에 걸쳐 무언가의 분산을 비교할 수도 있습니다. 이것은 또 다른 숨겨진 요소가 무언가에 영향을 미치고 분산을 변경하는 시기를 감지하는 데 도움이 될 수 있습니다.
분산은 표준 편차로 알려진 다른 통계량과도 밀접한 관련이 있습니다. 분산을 계산하는 데 사용되는 값은 제곱임을 기억하십시오 . (Remember)이는 분산이 원래 값의 동일한 단위로 표현되지 않음을 의미합니다. 표준 편차는 값을 원래 단위로 되돌리기 위해 분산의 제곱근을 취해야 합니다. 따라서 데이터가 킬로그램 단위인 경우 표준 편차도 마찬가지입니다.
모집단(Between Population) 과 표본 분산 중에서(Sample Variance) 선택하기
Excel 에는 수식이 약간 다른 두 가지 하위 유형이 있습니다 . 어떤 것을(Which one) 선택해야 하는지는 데이터에 따라 다릅니다. 데이터에 전체 "인구"가 포함된 경우 모집단 분산을 사용해야 합니다. 이 경우 "인구"는 대상 인구 그룹의 모든 구성원에 대한 모든 값이 있음을 의미합니다.
예를 들어, 왼손잡이 사람들의 체중을 보고 있다면 인구에는 왼손잡이인 지구상의 모든 개인이 포함됩니다. 모두 무게를 측정했다면 모집단 분산을 사용합니다.
물론 실생활에서 우리는 일반적으로 더 큰 모집단에서 더 작은 표본에 만족합니다. 이 경우 표본 분산을 사용합니다. 모집단(Population) 분산은 더 작은 모집단에서 여전히 실용적입니다. 예를 들어 회사에는 각 직원에 대한 데이터가 있는 직원이 수십만 또는 수천 명일 수 있습니다. 그들은 통계적 의미에서 "인구"를 나타냅니다.
올바른 분산 공식 선택
Excel에는 세 가지 표본 분산 공식과 세 가지 모집단 분산 공식이 있습니다.
- (VAR)표본 분산에 대한 VAR , VAR.S 및 VARA .
- (VARP)모집단 분산에 대한 VARP , VAR.P 및 VARPA .
VAR 및 VARP 는 무시할 수 있습니다 . 이것들은 구식이며 레거시 스프레드시트와의 호환성을 위해서만 사용됩니다.
그러면 숫자 값 집합의 분산을 계산하기 위한 VAR.S 및 VAR.P 와 텍스트 문자열을 포함하는 VARA 및 VARPA 가 남습니다.(VARPA)
VARA 및 VARPA 는 "TRUE" 및 "FALSE"를 제외한 모든 텍스트 문자열을 숫자 값 0으로 변환합니다. 이들은 각각 1과 0으로 변환됩니다.
가장 큰 차이점은 VAR.S 및 VAR.P 가 숫자가 아닌 값을 건너뛴다는 것입니다. 이렇게 하면 총 값 수에서 해당 케이스가 제외됩니다. 즉, 평균을 얻기 위해 더 적은 수의 케이스로 나누어야 하기 때문에 평균 값이 달라집니다.
Excel에서 차이를 계산하는 방법
Excel 에서 분산을 계산하는 데 필요한 것은 값 집합뿐입니다. 아래 예에서는 VAR.S 를 사용 하지만 공식과 방법은 사용하는 분산 공식에 관계없이 정확히 동일합니다.
- 범위 또는 불연속 값 집합이 준비되어 있다고 가정하고 원하는 빈 셀(empty cell) 을 선택합니다.
- 수식 필드에 =VAR.S(XX:YY) 를 입력 합니다. 여기서 X 및 Y 값은 범위의 첫 번째 및 마지막 셀 번호로 바뀝니다.
- Enter 키(Enter) 를 눌러 계산을 완료합니다.
또는 특정 값을 지정할 수 있습니다. 이 경우 수식은 =VAR.S(1,2,3,4) 와 같습니다 . 숫자가 분산을 계산하는 데 필요한 것으로 대체되었습니다. 이와 같이 수동으로 최대 254개의 값을 입력할 수 있지만 소수의 값만 있는 경우가 아니면 셀 범위에 데이터를 입력한 다음 위에서 설명한 수식의 셀 범위 버전을 사용하는 것이 거의 항상 더 좋습니다.
당신은 Excel에서 Excel을 할 수 있습니다, Er, Excel
분산 계산은 Excel(Excel) 에서 통계 작업을 수행해야 하는 모든 사용자에게 유용한 트릭입니다 . 그러나 이 기사에서 사용한 Excel 용어가 혼란스럽다면 Microsoft Excel 기본 자습서 - Excel 사용 방법 학습 을(Microsoft Excel Basics Tutorial – Learning How to Use Excel) 확인하는 것이 좋습니다.
반면에 더 많은 준비가 되었다면 Excel 산점도에 선형 회귀 추세선 추가(Add a Linear Regression Trendline to an Excel Scatter Plot) 를 확인 하여 산술 평균과 관련하여 데이터 세트의 분산 또는 기타 측면을 시각화할 수 있습니다.
How to Calculate Variance in Excel
Ѕo yoυ’ve been asked to calculate variance using Excel, but you aren’t sure what that means or how to do it. Dоn’t worry, it’s an easy concept аnd еven еasier process. You’ll be a variance pro in no time!
What Is Variance?
“Variance” is a way to measure the average distance from the mean. The “mean” is the sum of all values in a dataset divided by the number of values. Variance gives us an idea of whether the values in that data set tend, on average, to stick uniformly to the mean or scatter all over the place.
Mathematically, variance isn’t that complex:
- Calculate the mean of a set of values. To calculate the mean, take the sum of all the values divided by the number of values.
- Take every value in your set and subtract it from the mean.
- Square the resulting values (to cancel out negative numbers).
- Add all the squared values together.
- Calculate the mean of the squared values to get the variance.
So as you can see, it’s not a hard value to calculate. However, if you have hundreds or thousands of values, it would take forever to do manually. So it’s a good thing that Excel can automate the process!
What Do You Use Variance For?
Variance by itself has a number of uses. From a purely statistical perspective, it’s a good shorthand way to express how spread out a set of data is. Investors use variance to estimate the risk of a given investment.
For example, by taking a stock’s value over a period of time and calculating its variance, you’ll get a good idea of its volatility in the past. Under the assumption that the past predicts the future, it would mean that something with low variance is safer and more predictable.
You can also compare the variances of something across different time periods. This can help detect when another hidden factor is influencing something, changing its variance.
Variance is also strongly-related to another statistic known as the standard deviation. Remember that the values used to calculate variance are squared. This means that variance is not expressed in the same unit of the original value. The standard deviation requires taking the square root of variance to return the value to its original unit. So if the data was in kilograms then the standard deviation is as well.
Choosing Between Population and Sample Variance
There are two subtypes of variance with slightly different formulas in Excel. Which one you should choose depends on your data. If your data includes the entire “population” then you should use population variance. In this case “population” means that you have every value for every member of the target population group.
For example, if you’re looking at the weight of left-handed people, then the population includes every individual on Earth who’s left-handed. If you’ve weighed them all, you’d use population variance.
Of course, in real life we usually settle for a smaller sample from a larger population. In which case you’d use sample variance. Population variance is still practical with smaller populations. For example, a company may have a few hundred or few thousand employees with data on each employee. They represent a “population” in the statistical sense.
Choosing the Right Variance Formula
There are three sample variance formulas and three population variance formulas in Excel:
- VAR, VAR.S and VARA for sample variance.
- VARP, VAR.P and VARPA for population variance.
You can ignore VAR and VARP. These are outdated and are only around for compatibility with legacy spreadsheets.
That leaves VAR.S and VAR.P, which are for calculating the variance of a set of numerical values and VARA and VARPA, which include text strings.
VARA and VARPA will convert any text string to the numerical value 0, with the exception of “TRUE” and “FALSE”. These are converted to 1 and 0 respectively.
The biggest difference is that VAR.S and VAR.P skip over any non-numerical values. This excludes those cases from the total number of values, which means the mean value will be different, because you’re dividing by a smaller number of cases to get the mean.
How to Calculate Variance in Excel
All you need to calculate variance in Excel is a set of values. We’re going to use VAR.S in the example below, but the formula and methods are exactly the same regardless of which variance formula you use:
- Assuming you have a range or discrete set of values ready, select the empty cell of your choice.
- In the formula field, type =VAR.S(XX:YY) where the X and Y values are replaced by the first and last cell numbers of the range.
- Press Enter to complete the calculation.
Alternatively, you can specify specific values, in which case the formula looks like =VAR.S(1,2,3,4). With the numbers replaced with whatever you need to calculate the variance of. You can enter up to 254 values manually like this, but unless you only have a handful of values it’s almost always better to enter your data in a cell range and then use the cell range version of the formula discussed above.
You Can Excel at, Er, Excel
Calculating variance is a useful trick to know for anyone who needs to do some statistical work in Excel. But if any of the Excel terminology we used in this article was confusing, consider checking out Microsoft Excel Basics Tutorial – Learning How to Use Excel.
If, on the other hand, you’re ready for more, check out Add a Linear Regression Trendline to an Excel Scatter Plot so you can visualize variance or any other aspect of your data set in relation to the arithmetic mean.