분류 전체보기
-
두 변수 간의 관계 측정경제 2024. 9. 14. 21:08
두 변수 간의 관계를 측정하는 방법으로 크게 두 가지가 있다. 1. 공분산(Covariance) 공분산은 두 변수가 어떤 방향으로 변하는지를 나타내는 지표다.만약 두 변수가 같은 방향으로 변하면 공분산은 양수고, 반대 방향으로 변하면 공분산은 음수다.하지만 공분산은 단위에 의존하니까, 단위가 달라지면 해석이 어렵다. 샘플에서 공분산을 계산하려면 이 공식을 쓴다. xi: 첫 번째 변수의 각 데이터 값.xˉ: 첫 번째 변수의 평균.yi: 두 번째 변수의 각 데이터 값.yˉ: 두 번째 변수의 평균.n: 샘플의 개수.각각의 x값에서 평균을 빼고, 각각의 y값에서도 평균을 빼서 그 두 값을 곱한 후 다 더하고 그 값을 샘플 수 - 1로 나누면 샘플의 공분산을 구할 수 있다. 모집단에서 공분산을 구할 땐 아래 ..
-
상자 그림(Box Plot)이란?경제 2024. 9. 14. 20:43
상자 그림(Box Plot)은 주로 데이터의 분포와 극단값(outliers)을 쉽게 확인할 수 있고, 상자 그림은 사분위수로 만들어져 있다. 상자의 끝은 1사분위수(Q1)와 3사분위수(Q3) 위치를 나타낸다.Q1 (첫 번째 사분위수) = 445Q3 (세 번째 사분위수) = 525상자 안에 있는 세로선은 중앙값(중위수, Q2)을 나타낸다.Q2 (중앙값, 메디안이라고 부른다) = 475 상자 그림(Box Plot)에서 Outlier를 판별하는 기준은 다음과 같다.1. IQR(Interquartile Range) 계산IQR은 Q3 - Q1, 즉 3사분위수와 1사분위수의 차이다. 여기서는 525 - 445 = 80이 된다. 2. Lower Limit (하한선)하한선은 Q1에서 1.5배의 IQR을 뺀 값이다.공식..
-
Outlier란?경제 2024. 9. 14. 20:31
Outlier란 데이터 세트에서 너무 크거나 너무 작은 값을 말한다.쉽게 말하면, 평범한 데이터들이랑 비교했을 때 확 튀는 값들이다. outlier를 찾는 방법 중 하나는 z-점수를 사용하는 건데, z-점수가 -3보다 작거나 +3보다 큰 값은 보통 outlier로 간주된다고 한다. Outlier는 몇 가지 이유로 발생할 수 있다.1. 잘못 기록된 데이터일 수 있다. 2. 데이터 세트에 잘못 포함된 값일 수도 있다. 3. 하지만 가끔은 그냥 그 데이터 세트에 정상적으로 포함된 값일 수도 있다. 아무리 특정 데이터가 극단적인 값처럼 보여도 z-점수가 절대값 3을 넘지 않으면 outlier로 취급되지 않는다.
-
Empirical Rule (경험적 규칙)경제 2024. 9. 14. 19:52
Empirical Rule (경험적 규칙)은 데이터가 정규분포를 따를 때 매우 유용하게 사용된다.이 규칙은 데이터가 평균 주변에서 어떻게 분포하는지를 아주 잘 설명해준다. 이 규칙에는 다음과 같은 수치들이 나온다.68.26%, 95.44%, 99.72%각 ±1 ±2 ±3 표준편차 범위 내에 들어있는 데이터의 양을 말한다. 이 경험적 규칙은 특히 데이터의 이상치를 식별하거나, 데이터가 얼마나 집중되어 있는지를 빠르게 파악할 때 매우 유용하다. 그럼 경험적 규칙과 체르셰프의 정리와의 차이는 뭘까? 경험적 규칙은 정규분포에서만 적용된다. 정규분포가 "종 모양"으로 대칭적인 형태이기 때문에, 이 비율이 항상 일정하게 적용된다. 체르셰프는 모든 분포에 적용된다. 정규분포일 필요가 없다는 게 큰 차이점이다.하지만 ..
-
Chebyshev's Theorem(체비셰프의 정리)경제 2024. 9. 14. 19:44
체비셰프의 정리는 데이터가 평균에서 얼마나 떨어져 있는지를 알려주는 거다.특히, z 표준편차만큼 떨어진 범위 안에 최소한 몇 퍼센트의 데이터가 들어오는지 보장해준다. 더 쉽게 풀어보면데이터의 최소 (1 - 1/z²) 비율이 평균으로부터 z 표준편차 이내에 포함된다.z는 1보다 큰 값이다. 예를 들어, z가 2일 때는 즉, 최소한 75%의 데이터가 평균에서 2개의 표준편차 안에 포함된다는 거다.중요한 건 이 공식을 통해 데이터가 평균에 얼마나 가까이 몰려 있는지를 대략적으로 알 수 있다는 거다. 응용을 해보자평균 점수는 70점이고, 표준편차는 5점, 내가 구해야 할 건, 60점에서 80점 사이에 몇 명의 학생이 있는지다.60점에서 80점에 대한 z-score를 각각 계산해야 한다.60점의 z-score 계..
-
@keyframes를 활용한 애니메이션 주기개발/css 2024. 9. 12. 20:58
다음은 좌우 이동 애니메이션 예제다artist { width: 100px; height: 100px; background: red; position: relative; animation: mymove 5s infinite; } @keyframes mymove { from {left: 0px;} to {left: 400px;} } mymove라는 애니메이션을 5초 사이클의 애니메이션이 무한정 반복되는 코드다.mymove는 5초 동안 왼쪽 0px에서 오른쪽 400px까지 이동하고, 애니메이션이 끝나면 다시 0px로 순간 이동한 후에 다시 시작한다.그래서 애니메이션이 끝날 때마다 순간적으로 제자리로 돌아가고, 그걸 무한히 반복한다. 만약 이런 순간 이동이 어..
-
text-shadow의 인자값을 알아보자개발/css 2024. 9. 12. 20:43
text-shadow: 2px 2px 5px red;다음과 같은 text-shadow 코드가 있다고 해보자 첫번째 2px은 그림자의 X축 오프셋이다. 텍스트를 기준으로 가로 방향으로 그림자가 얼마나 이동할지를 결정한다.양수면 오른쪽으로, 음수면 왼쪽으로 그림자가 이동한다. 두번째 2px은 그림자의 Y축 오프셋이다. 양수면 아래로, 음수면 위로 그림자가 이동한다. 세번째 5px은 그림자의 블러 반경이다. 이 값이 클수록 그림자가 흐릿해진다. 네번째값인 red는 그림자의 색상이다.