ಸಂಖ್ಯಾಶಾಸ್ತ್ರ ಕ್ಯಾಲ್ಕುಲೇಟರ್
ಸರಾಸರಿ, ಮಧ್ಯಮ, ಬಹುಪದ, ಪ್ರಮಾಣಿತ ವಿಚಲನೆ, ಮತ್ತು ಸುಧಾರಿತ ಅಳತೆಗಳನ್ನು ಒಳಗೊಂಡಂತೆ ವ್ಯಾಪಕ ವಿವರಣಾತ್ಮಕ ಸಂಖ್ಯಾಶಾಸ್ತ್ರಗಳನ್ನು ಲೆಕ್ಕಹಾಕಿ
ಸಂಖ್ಯಾಶಾಸ್ತ್ರ ಕ್ಯಾಲ್ಕುಲೇಟರ್ ಅನ್ನು ಹೇಗೆ ಬಳಸುವುದು
- ನಿಮ್ಮ ಡೇಟಾ ಮಾದರಿಯನ್ನು ಅಥವಾ ಸಂಪೂರ್ಣ ಜನಸಂಖ್ಯೆಯನ್ನು ಪ್ರತಿನಿಧಿಸುತ್ತದೆಯೇ ಎಂದು ಆಯ್ಕೆಮಾಡಿ
- ನಿಮ್ಮ ಸಂಖ್ಯಾತ್ಮಕ ಡೇಟಾವನ್ನು ಅಲ್ಪವಿರಾಮ, ಸ್ಪೇಸ್, ಅಥವಾ ಸಾಲು ವಿರಾಮಗಳಿಂದ ಬೇರ್ಪಡಿಸಿ ನಮೂದಿಸಿ
- ಮಾದರಿ ಡೇಟಾಸೆಟ್ಗಳನ್ನು (ಪರೀಕ್ಷಾ ಅಂಕಗಳು, ವಯಸ್ಸುಗಳು, ಮಾರಾಟ) ಪ್ರಯತ್ನಿಸಲು ಉದಾಹರಣೆ ಬಟನ್ಗಳನ್ನು ಬಳಸಿ
- ಮೂಲಭೂತ ಸಂಖ್ಯಾಶಾಸ್ತ್ರಗಳನ್ನು ಪರಿಶೀಲಿಸಿ: ಸರಾಸರಿ, ಮಧ್ಯಮ, ವ್ಯಾಪ್ತಿ, ಮತ್ತು ಪ್ರಮಾಣಿತ ವಿಚಲನೆ
- ಚತುರ್ಥಕಗಳು, ವಕ್ರತೆ, ಮತ್ತು ಕುರ್ಟೋಸಿಸ್ಗಾಗಿ ಸುಧಾರಿತ ಸಂಖ್ಯಾಶಾಸ್ತ್ರಗಳನ್ನು ವಿಸ್ತರಿಸಿ
- ಮೌಲ್ಯ ವಿತರಣೆಗಳನ್ನು ನೋಡಲು ಆವರ್ತನ ಕೋಷ್ಟಕವನ್ನು ವೀಕ್ಷಿಸಿ
- ವಿತರಣೆಯ ಆಕಾರ ವಿಶ್ಲೇಷಣೆಗಾಗಿ ವಕ್ರತೆ ಮತ್ತು ಕುರ್ಟೋಸಿಸ್ ಅನ್ನು ವ್ಯಾಖ್ಯಾನಿಸಿ
ವಿವರಣಾತ್ಮಕ ಸಂಖ್ಯಾಶಾಸ್ತ್ರವನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವುದು
ವಿವರಣಾತ್ಮಕ ಸಂಖ್ಯಾಶಾಸ್ತ್ರವು ಡೇಟಾಸೆಟ್ನ ಮುಖ್ಯ ಲಕ್ಷಣಗಳನ್ನು ಸಂಕ್ಷಿಪ್ತವಾಗಿ ವಿವರಿಸುತ್ತದೆ, ಕೇಂದ್ರ ಪ್ರವೃತ್ತಿ, ವ್ಯತ್ಯಾಸ, ಮತ್ತು ವಿತರಣೆಯ ಆಕಾರದ ಬಗ್ಗೆ ಒಳನೋಟಗಳನ್ನು ನೀಡುತ್ತದೆ.
ಸರಾಸರಿ (ಸರಾಸರಿ)
ಸೂತ್ರ: Σx / n
ಎಲ್ಲಾ ಮೌಲ್ಯಗಳ ಮೊತ್ತವನ್ನು ಮೌಲ್ಯಗಳ ಸಂಖ್ಯೆಯಿಂದ ಭಾಗಿಸುವುದು. ಕೇಂದ್ರ ಪ್ರವೃತ್ತಿಯ ಅತ್ಯಂತ ಸಾಮಾನ್ಯ ಅಳತೆ.
ಬಳಕೆ: ಅತಿಯಾದ ಹೊರಗಿನವರಿಲ್ಲದ ಸಮ್ಮಿತೀಯ ವಿತರಣೆಗಳಿಗೆ ಉತ್ತಮ.
ಮಧ್ಯಮ
ಸೂತ್ರ: ಕ್ರಮದಲ್ಲಿರುವಾಗ ಮಧ್ಯಮ ಮೌಲ್ಯ
ಡೇಟಾವನ್ನು ಕ್ರಮದಲ್ಲಿ ಜೋಡಿಸಿದಾಗ ಮಧ್ಯಮ ಮೌಲ್ಯ. ಡೇಟಾಸೆಟ್ ಅನ್ನು ಎರಡು ಸಮಾನ ಭಾಗಗಳಾಗಿ ವಿಭಜಿಸುತ್ತದೆ.
ಬಳಕೆ: ವಕ್ರ ವಿತರಣೆಗಳು ಅಥವಾ ಹೊರಗಿನವರನ್ನು ಹೊಂದಿರುವ ಡೇಟಾಸೆಟ್ಗಳಿಗೆ ಸರಾಸರಿಗಿಂತ ಉತ್ತಮ.
ಬಹುಪದ
ಸೂತ್ರ: ಅತ್ಯಂತ ಆಗಾಗ್ಗೆ ಬರುವ ಮೌಲ್ಯ(ಗಳು)
ಡೇಟಾಸೆಟ್ನಲ್ಲಿ ಅತ್ಯಂತ ಆಗಾಗ್ಗೆ ಕಾಣಿಸಿಕೊಳ್ಳುವ ಮೌಲ್ಯ(ಗಳು). ಅನೇಕ ಬಹುಪದಗಳು ಇರಬಹುದು.
ಬಳಕೆ: ವರ್ಗೀಕೃತ ಡೇಟಾ ಮತ್ತು ಅತ್ಯಂತ ಸಾಮಾನ್ಯ ಮೌಲ್ಯಗಳನ್ನು ಗುರುತಿಸಲು ಉಪಯುಕ್ತ.
ಪ್ರಮಾಣಿತ ವಿಚಲನೆ
ಸೂತ್ರ: √(Σ(x-μ)²/n)
ಡೇಟಾ ಬಿಂದುಗಳು ಸರಾಸರಿಯಿಂದ ಎಷ್ಟು ಹರಡಿವೆ ಎಂಬುದನ್ನು ಅಳೆಯುತ್ತದೆ. ಕಡಿಮೆ ಮೌಲ್ಯಗಳು ಕಡಿಮೆ ವ್ಯತ್ಯಾಸವನ್ನು ಸೂಚಿಸುತ್ತವೆ.
ಬಳಕೆ: 68% ಡೇಟಾ ಸರಾಸರಿಯ 1 SD ಒಳಗೆ, 95% 2 SD ಒಳಗೆ ಬರುತ್ತದೆ (ಸಾಮಾನ್ಯ ವಿತರಣೆ).
ವ್ಯತ್ಯಾಸ
ಸೂತ್ರ: (ಪ್ರಮಾಣಿತ ವಿಚಲನೆ)²
ಸರಾಸರಿಯಿಂದ ವರ್ಗೀಕೃತ ವ್ಯತ್ಯಾಸಗಳ ಸರಾಸರಿ. ಘಟಕವು ಮೂಲ ಘಟಕಗಳ ವರ್ಗವಾಗಿದೆ.
ಬಳಕೆ: ವ್ಯತ್ಯಾಸವನ್ನು ಅಳೆಯುತ್ತದೆ; ಹೆಚ್ಚಿನ ಮೌಲ್ಯಗಳು ಡೇಟಾದಲ್ಲಿ ಹೆಚ್ಚಿನ ಹರಡುವಿಕೆಯನ್ನು ಸೂಚಿಸುತ್ತವೆ.
ವ್ಯಾಪ್ತಿ
ಸೂತ್ರ: ಗರಿಷ್ಠ - ಕನಿಷ್ಠ
ಡೇಟಾಸೆಟ್ನಲ್ಲಿ ಅತ್ಯುನ್ನತ ಮತ್ತು ಅತ್ಯಂತ ಕಡಿಮೆ ಮೌಲ್ಯಗಳ ನಡುವಿನ ವ್ಯತ್ಯಾಸ.
ಬಳಕೆ: ಹರಡುವಿಕೆಯ ಸರಳ ಅಳತೆ; ಹೊರಗಿನವರಿಗೆ ಸೂಕ್ಷ್ಮ.
ಮಾದರಿ vs ಜನಸಂಖ್ಯಾ ಸಂಖ್ಯಾಶಾಸ್ತ್ರಗಳು
ಮಾದರಿ ಮತ್ತು ಜನಸಂಖ್ಯೆಯ ನಡುವಿನ ಆಯ್ಕೆಯು ವ್ಯತ್ಯಾಸ ಮತ್ತು ಪ್ರಮಾಣಿತ ವಿಚಲನೆಯನ್ನು ಹೇಗೆ ಲೆಕ್ಕಹಾಕಲಾಗುತ್ತದೆ ಎಂಬುದರ ಮೇಲೆ ಪರಿಣಾಮ ಬೀರುತ್ತದೆ.
ಜನಸಂಖ್ಯೆ
ಯಾವಾಗ ಬಳಸಬೇಕು: ನೀವು ಅಧ್ಯಯನ ಮಾಡುತ್ತಿರುವ ಸಂಪೂರ್ಣ ಗುಂಪಿನ ಡೇಟಾವನ್ನು ನೀವು ಹೊಂದಿರುವಾಗ
ವ್ಯತ್ಯಾಸ: σ² = Σ(x-μ)²/N
ಪ್ರಮಾಣಿತ ವಿಚಲನೆ: σ = √(Σ(x-μ)²/N)
ಉದಾಹರಣೆ: ಒಂದು ನಿರ್ದಿಷ್ಟ ತರಗತಿಯ ಎಲ್ಲಾ ವಿದ್ಯಾರ್ಥಿಗಳು, ಒಂದು ಕಂಪನಿಯ ಎಲ್ಲಾ ಉದ್ಯೋಗಿಗಳು
N (ಒಟ್ಟು ಎಣಿಕೆ) ನಿಂದ ಭಾಗಿಸುವುದು
ಮಾದರಿ
ಯಾವಾಗ ಬಳಸಬೇಕು: ನೀವು ದೊಡ್ಡ ಗುಂಪನ್ನು ಪ್ರತಿನಿಧಿಸುವ ಉಪಗುಂಪಿನಿಂದ ಡೇಟಾವನ್ನು ಹೊಂದಿರುವಾಗ
ವ್ಯತ್ಯಾಸ: s² = Σ(x-x̄)²/(n-1)
ಪ್ರಮಾಣಿತ ವಿಚಲನೆ: s = √(Σ(x-x̄)²/(n-1))
ಉದಾಹರಣೆ: ಎಲ್ಲಾ ಶಾಲೆಗಳಿಂದ ವಿದ್ಯಾರ್ಥಿಗಳ ಯಾದೃಚ್ಛಿಕ ಮಾದರಿ, ಸಮೀಕ್ಷೆಯ ಪ್ರತಿಕ್ರಿಯೆದಾರರು
ಪಕ್ಷಪಾತವಿಲ್ಲದ ಅಂದಾಜಿಗಾಗಿ n-1 (ಬೆಸೆಲ್ನ ತಿದ್ದುಪಡಿ) ನಿಂದ ಭಾಗಿಸುವುದು
ಸುಧಾರಿತ ಸಂಖ್ಯಾಶಾಸ್ತ್ರೀಯ ಅಳತೆಗಳು
ಚತುರ್ಥಕಗಳು (Q1, Q3)
ಕ್ರಮಬದ್ಧ ಡೇಟಾವನ್ನು ನಾಲ್ಕು ಸಮಾನ ಭಾಗಗಳಾಗಿ ವಿಭಜಿಸುವ ಮೌಲ್ಯಗಳು. Q1 25ನೇ ಶೇಕಡಾವಾರು, Q3 75ನೇ ಶೇಕಡಾವಾರು.
ವ್ಯಾಖ್ಯಾನ: Q1: 25% ಡೇಟಾ ಈ ಮೌಲ್ಯಕ್ಕಿಂತ ಕೆಳಗಿದೆ. Q3: 75% ಡೇಟಾ ಈ ಮೌಲ್ಯಕ್ಕಿಂತ ಕೆಳಗಿದೆ.
ಬಳಕೆಗಳು: ಬಾಕ್ಸ್ ಪ್ಲಾಟ್ಗಳು, ಹೊರಗಿನವರನ್ನು ಗುರುತಿಸುವುದು, ಡೇಟಾ ವಿತರಣೆಯನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವುದು
ಅಂತರ ಚತುರ್ಥಕ ವ್ಯಾಪ್ತಿ (IQR)
Q3 ಮತ್ತು Q1 ನಡುವಿನ ವ್ಯಾಪ್ತಿ (IQR = Q3 - Q1). ಡೇಟಾದ ಮಧ್ಯಮ 50% ನ ಹರಡುವಿಕೆಯನ್ನು ಅಳೆಯುತ್ತದೆ.
ವ್ಯಾಖ್ಯಾನ: ವ್ಯಾಪ್ತಿಗಿಂತ ಹೊರಗಿನವರಿಗೆ ಕಡಿಮೆ ಸೂಕ್ಷ್ಮ. ದೊಡ್ಡ IQR ಕೇಂದ್ರ ಡೇಟಾದಲ್ಲಿ ಹೆಚ್ಚಿನ ವ್ಯತ್ಯಾಸವನ್ನು ಸೂಚಿಸುತ್ತದೆ.
ಬಳಕೆಗಳು: ಹೊರಗಿನವರ ಪತ್ತೆ (ಚತುರ್ಥಕಗಳಿಂದ 1.5×IQR ಗಿಂತ ಹೆಚ್ಚಿನ ಮೌಲ್ಯಗಳು), ಹರಡುವಿಕೆಯ ದೃಢವಾದ ಅಳತೆ
ವಕ್ರತೆ
ವಿತರಣೆಯ ಅಸಮಮಿತಿಯನ್ನು ಅಳೆಯುತ್ತದೆ. ಡೇಟಾ ಎಡಕ್ಕೆ ಅಥವಾ ಬಲಕ್ಕೆ ವಾಲುತ್ತದೆಯೇ ಎಂದು ಸೂಚಿಸುತ್ತದೆ.
ವ್ಯಾಖ್ಯಾನ: 0 = ಸಮ್ಮಿತೀಯ, >0 = ಬಲ-ವಕ್ರ (ಬಾಲ ಬಲಕ್ಕೆ ವಿಸ್ತರಿಸುತ್ತದೆ), <0 = ಎಡ-ವಕ್ರ (ಬಾಲ ಎಡಕ್ಕೆ ವಿಸ್ತರಿಸುತ್ತದೆ)
ವ್ಯಾಪ್ತಿಗಳು: ±0.5 = ಸುಮಾರು ಸಮ್ಮಿತೀಯ, ±0.5 ರಿಂದ ±1 = ಮಧ್ಯಮ ವಕ್ರ, >±1 = ಹೆಚ್ಚು ವಕ್ರ
ಕುರ್ಟೋಸಿಸ್
ಸಾಮಾನ್ಯ ವಿತರಣೆಗೆ ಹೋಲಿಸಿದರೆ ವಿತರಣೆಯ 'ಬಾಲದ ಭಾರ'ವನ್ನು ಅಳೆಯುತ್ತದೆ.
ವ್ಯಾಖ್ಯಾನ: 0 = ಸಾಮಾನ್ಯ, >0 = ಭಾರೀ ಬಾಲಗಳು (ಲೆಪ್ಟೋಕುರ್ಟಿಕ್), <0 = ಹಗುರ ಬಾಲಗಳು (ಪ್ಲಾಟಿಕುರ್ಟಿಕ್)
ಬಳಕೆಗಳು: ಅಪಾಯದ ಮೌಲ್ಯಮಾಪನ, ಗುಣಮಟ್ಟ ನಿಯಂತ್ರಣ, ವಿತರಣೆಯ ಆಕಾರವನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವುದು
ಸಂಖ್ಯಾಶಾಸ್ತ್ರದ ಪ್ರಾಯೋಗಿಕ ಅನ್ವಯಗಳು
ಶಿಕ್ಷಣ
- ಗ್ರೇಡ್ ವಿಶ್ಲೇಷಣೆ ಮತ್ತು ಗ್ರೇಡಿಂಗ್ ಕರ್ವ್ಗಳು
- ಪ್ರಮಾಣೀಕೃತ ಪರೀಕ್ಷಾ ಅಂಕಗಳ ವ್ಯಾಖ್ಯಾನ
- ವಿದ್ಯಾರ್ಥಿ ಕಾರ್ಯಕ್ಷಮತೆಯ ಮೌಲ್ಯಮಾಪನ
ಉದಾಹರಣೆ: ಗ್ರೇಡ್ಗಳು ಸಾಮಾನ್ಯ ವಿತರಣೆಯನ್ನು ಅನುಸರಿಸುತ್ತವೆಯೇ ಎಂದು ನಿರ್ಧರಿಸಲು ತರಗತಿಯ ಪರೀಕ್ಷಾ ಅಂಕಗಳನ್ನು ವಿಶ್ಲೇಷಿಸುವುದು
ಪ್ರಮುಖ ಸಂಖ್ಯಾಶಾಸ್ತ್ರಗಳು: ಸರಾಸರಿ, ಪ್ರಮಾಣಿತ ವಿಚಲನೆ, ಶೇಕಡಾವಾರುಗಳು
ವ್ಯಾಪಾರ ಮತ್ತು ಹಣಕಾಸು
- ಮಾರಾಟ ಕಾರ್ಯಕ್ಷಮತೆಯ ವಿಶ್ಲೇಷಣೆ
- ಅಪಾಯದ ಮೌಲ್ಯಮಾಪನ
- ಗುಣಮಟ್ಟ ನಿಯಂತ್ರಣ
- ಮಾರುಕಟ್ಟೆ ಸಂಶೋಧನೆ
ಉದಾಹರಣೆ: ಪ್ರವೃತ್ತಿಗಳನ್ನು ಗುರುತಿಸಲು ಮತ್ತು ಗುರಿಗಳನ್ನು ಹೊಂದಿಸಲು ಮಾಸಿಕ ಮಾರಾಟ ಡೇಟಾವನ್ನು ವಿಶ್ಲೇಷಿಸುವುದು
ಪ್ರಮುಖ ಸಂಖ್ಯಾಶಾಸ್ತ್ರಗಳು: ಸರಾಸರಿ, ವ್ಯತ್ಯಾಸ, ವಕ್ರತೆ, ಪ್ರವೃತ್ತಿ ವಿಶ್ಲೇಷಣೆ
ಆರೋಗ್ಯ ರಕ್ಷಣೆ
- ರೋಗಿಗಳ ಡೇಟಾ ವಿಶ್ಲೇಷಣೆ
- ಕ್ಲಿನಿಕಲ್ ಪ್ರಯೋಗದ ಫಲಿತಾಂಶಗಳು
- ಸಾಂಕ್ರಾಮಿಕ ರೋಗಶಾಸ್ತ್ರೀಯ ಅಧ್ಯಯನಗಳು
- ಉಲ್ಲೇಖ ಶ್ರೇಣಿಯ ಸ್ಥಾಪನೆ
ಉದಾಹರಣೆ: ರಕ್ತದೊತ್ತಡ ಅಥವಾ ಕೊಲೆಸ್ಟ್ರಾಲ್ ಮಟ್ಟಗಳಿಗೆ ಸಾಮಾನ್ಯ ಶ್ರೇಣಿಗಳನ್ನು ನಿರ್ಧರಿಸುವುದು
ಪ್ರಮುಖ ಸಂಖ್ಯಾಶಾಸ್ತ್ರಗಳು: ಶೇಕಡಾವಾರುಗಳು, ಪ್ರಮಾಣಿತ ವಿಚಲನೆ, ಜನಸಂಖ್ಯೆ vs ಮಾದರಿ
ಕ್ರೀಡಾ ವಿಶ್ಲೇಷಣೆ
- ಆಟಗಾರರ ಕಾರ್ಯಕ್ಷಮತೆಯ ಮೌಲ್ಯಮಾಪನ
- ತಂಡದ ಸಂಖ್ಯಾಶಾಸ್ತ್ರಗಳು
- ಆಟದ ಫಲಿತಾಂಶದ ಭವಿಷ್ಯ
ಉದಾಹರಣೆ: ಋತುಗಳಲ್ಲಿ ಬಾಸ್ಕೆಟ್ಬಾಲ್ ಆಟಗಾರನ ಶೂಟಿಂಗ್ ಶೇಕಡಾವಾರುಗಳನ್ನು ವಿಶ್ಲೇಷಿಸುವುದು
ಪ್ರಮುಖ ಸಂಖ್ಯಾಶಾಸ್ತ್ರಗಳು: ಸರಾಸರಿ, ಸ್ಥಿರತೆ (ಪ್ರಮಾಣಿತ ವಿಚಲನೆ), ಕಾರ್ಯಕ್ಷಮತೆಯ ಪ್ರವೃತ್ತಿಗಳು
ತಯಾರಿಕೆ
- ಗುಣಮಟ್ಟ ನಿಯಂತ್ರಣ
- ಪ್ರಕ್ರಿಯೆ ಸುಧಾರಣೆ
- ದೋಷ ವಿಶ್ಲೇಷಣೆ
- ಸಿಕ್ಸ್ ಸಿಗ್ಮಾ ವಿಧಾನಗಳು
ಉದಾಹರಣೆ: ಗುಣಮಟ್ಟದ ಮಾನದಂಡಗಳನ್ನು ನಿರ್ವಹಿಸಲು ಉತ್ಪನ್ನದ ಆಯಾಮಗಳನ್ನು ಮೇಲ್ವಿಚಾರಣೆ ಮಾಡುವುದು
ಪ್ರಮುಖ ಸಂಖ್ಯಾಶಾಸ್ತ್ರಗಳು: ನಿಯಂತ್ರಣ ಮಿತಿಗಳು, ವ್ಯತ್ಯಾಸ, ಪ್ರಕ್ರಿಯೆಯ ಸಾಮರ್ಥ್ಯ
ಸಂಶೋಧನೆ ಮತ್ತು ವಿಜ್ಞಾನ
- ಪ್ರಾಯೋಗಿಕ ಡೇಟಾ ವಿಶ್ಲೇಷಣೆ
- ಕಲ್ಪನೆ ಪರೀಕ್ಷೆಯ ತಯಾರಿ
- ಡೇಟಾ ಸಂಕ್ಷಿಪ್ತೀಕರಣ
- ಪ್ರಕಟಣೆ ವರದಿಗಾರಿಕೆ
ಉದಾಹರಣೆ: ಸಂಖ್ಯಾಶಾಸ್ತ್ರೀಯ ಪರೀಕ್ಷೆಯ ಮೊದಲು ಪ್ರಾಯೋಗಿಕ ಫಲಿತಾಂಶಗಳನ್ನು ಸಂಕ್ಷಿಪ್ತಗೊಳಿಸುವುದು
ಪ್ರಮುಖ ಸಂಖ್ಯಾಶಾಸ್ತ್ರಗಳು: ಸಂಪೂರ್ಣ ವಿವರಣಾತ್ಮಕ ಸಂಖ್ಯಾಶಾಸ್ತ್ರಗಳು, ವಿತರಣೆಯ ಮೌಲ್ಯಮಾಪನ
ತಪ್ಪಿಸಲು ಸಾಮಾನ್ಯ ಸಂಖ್ಯಾಶಾಸ್ತ್ರೀಯ ತಪ್ಪುಗಳು
ತಪ್ಪು: ಹೆಚ್ಚು ವಕ್ರ ಡೇಟಾದೊಂದಿಗೆ ಸರಾಸರಿಯನ್ನು ಬಳಸುವುದು
ಸಮಸ್ಯೆ: ಸರಾಸರಿಯು ಹೊರಗಿನವರು ಮತ್ತು ಅತಿಯಾದ ಮೌಲ್ಯಗಳಿಂದ ಹೆಚ್ಚು ಪ್ರಭಾವಿತವಾಗಿರುತ್ತದೆ
ಪರಿಹಾರ: ವಕ್ರ ವಿತರಣೆಗಳಿಗೆ ಮಧ್ಯಮವನ್ನು ಬಳಸಿ, ಅಥವಾ ಸರಾಸರಿ ಮತ್ತು ಮಧ್ಯಮ ಎರಡನ್ನೂ ವರದಿ ಮಾಡಿ
ಉದಾಹರಣೆ: ಆದಾಯ ಡೇಟಾ ಸಾಮಾನ್ಯವಾಗಿ ಬಲ-ವಕ್ರವಾಗಿರುತ್ತದೆ - ಮಧ್ಯಮ ಆದಾಯವು ಸರಾಸರಿಗಿಂತ ಹೆಚ್ಚು ಪ್ರತಿನಿಧಿಸುತ್ತದೆ
ತಪ್ಪು: ಮಾದರಿ ಮತ್ತು ಜನಸಂಖ್ಯಾ ಸಂಖ್ಯಾಶಾಸ್ತ್ರಗಳನ್ನು ಗೊಂದಲಗೊಳಿಸುವುದು
ಸಮಸ್ಯೆ: ತಪ್ಪು ಸೂತ್ರವನ್ನು ಬಳಸುವುದರಿಂದ ಪಕ್ಷಪಾತದ ಅಂದಾಜುಗಳು ಉಂಟಾಗುತ್ತವೆ
ಪರಿಹಾರ: ಡೇಟಾವು ದೊಡ್ಡ ಜನಸಂಖ್ಯೆಯಿಂದ ಮಾದರಿಯನ್ನು ಪ್ರತಿನಿಧಿಸುವಾಗ ಮಾದರಿ ಸಂಖ್ಯಾಶಾಸ್ತ್ರಗಳನ್ನು (n-1) ಬಳಸಿ
ಉದಾಹರಣೆ: 100,000 ಜನಸಂಖ್ಯೆಯ ನಗರವನ್ನು ಪ್ರತಿನಿಧಿಸುವ 100 ಜನರ ಸಮೀಕ್ಷೆಯ ಡೇಟಾಗೆ ಮಾದರಿ ಸೂತ್ರಗಳು ಬೇಕಾಗುತ್ತವೆ
ತಪ್ಪು: ಡೇಟಾ ವಿತರಣೆಯ ಆಕಾರವನ್ನು ನಿರ್ಲಕ್ಷಿಸುವುದು
ಸಮಸ್ಯೆ: ಅಸ್ತಿತ್ವದಲ್ಲಿಲ್ಲದಿದ್ದಾಗ ಸಾಮಾನ್ಯ ವಿತರಣೆಯನ್ನು ಊಹಿಸುವುದು
ಪರಿಹಾರ: ವಕ್ರತೆ ಮತ್ತು ಕುರ್ಟೋಸಿಸ್ ಅನ್ನು ಪರಿಶೀಲಿಸಿ; ವಿತರಣೆಯ ಪ್ರಕಾರಕ್ಕೆ ಸೂಕ್ತವಾದ ಸಂಖ್ಯಾಶಾಸ್ತ್ರಗಳನ್ನು ಬಳಸಿ
ಉದಾಹರಣೆ: ಸಾಮಾನ್ಯವಲ್ಲದ ಡೇಟಾಗೆ ಪ್ರಮಾಣಿತ ವಿಚಲನೆಯ ನಿಯಮಗಳನ್ನು ಬಳಸುವುದರಿಂದ ದಾರಿತಪ್ಪಿಸುವ ವ್ಯಾಖ್ಯಾನಗಳು ಉಂಟಾಗುತ್ತವೆ
ತಪ್ಪು: ಹೊರಗಿನವರನ್ನು ಪರಿಶೀಲಿಸದಿರುವುದು
ಸಮಸ್ಯೆ: ಹೊರಗಿನವರು ಸರಾಸರಿ ಮತ್ತು ಪ್ರಮಾಣಿತ ವಿಚಲನೆಯ ಮೇಲೆ ನಾಟಕೀಯವಾಗಿ ಪರಿಣಾಮ ಬೀರಬಹುದು
ಪರಿಹಾರ: IQR ಅಥವಾ z-ಸ್ಕೋರ್ ವಿಧಾನಗಳನ್ನು ಬಳಸಿ ಹೊರಗಿನವರನ್ನು ಗುರುತಿಸಿ; ಅವರ ಕಾರಣವನ್ನು ತನಿಖೆ ಮಾಡಿ
ಉದಾಹರಣೆ: ಒಂದು ಡೇಟಾ ನಮೂದು ದೋಷವು ಸಂಪೂರ್ಣ ಡೇಟಾಸೆಟ್ ಅನ್ನು ಹೆಚ್ಚು ವ್ಯತ್ಯಾಸಗೊಳ್ಳುವಂತೆ ಮಾಡಬಹುದು
ತಪ್ಪು: ಸಣ್ಣ ಮಾದರಿ ಸಂಖ್ಯಾಶಾಸ್ತ್ರಗಳನ್ನು ಅತಿಯಾಗಿ ವ್ಯಾಖ್ಯಾನಿಸುವುದು
ಸಮಸ್ಯೆ: ಸಣ್ಣ ಮಾದರಿಗಳು ನಿಜವಾದ ಜನಸಂಖ್ಯಾ ಗುಣಲಕ್ಷಣಗಳನ್ನು ಪ್ರತಿನಿಧಿಸದಿರಬಹುದು
ಪರಿಹಾರ: < 30 ಮಾದರಿಗಳೊಂದಿಗೆ ಜಾಗರೂಕರಾಗಿರಿ; ವಿಶ್ವಾಸಾರ್ಹ ಮಧ್ಯಂತರಗಳನ್ನು ಪರಿಗಣಿಸಿ
ಉದಾಹರಣೆ: 5 ಪರೀಕ್ಷಾ ಅಂಕಗಳ ಸರಾಸರಿಯು ಭವಿಷ್ಯದ ಕಾರ್ಯಕ್ಷಮತೆಯನ್ನು ವಿಶ್ವಾಸಾರ್ಹವಾಗಿ ಊಹಿಸದಿರಬಹುದು
ತಪ್ಪು: ಅತಿಯಾದ ದಶಮಾಂಶ ಸ್ಥಾನಗಳನ್ನು ವರದಿ ಮಾಡುವುದು
ಸಮಸ್ಯೆ: ಸುಳ್ಳು ನಿಖರತೆಯು ಅಸ್ತಿತ್ವದಲ್ಲಿಲ್ಲದ ನಿಖರತೆಯನ್ನು ಸೂಚಿಸುತ್ತದೆ
ಪರಿಹಾರ: ಡೇಟಾದ ನಿಖರತೆಯನ್ನು ಆಧರಿಸಿ ಸೂಕ್ತವಾದ ಮಹತ್ವದ ಅಂಕಿಗಳಿಗೆ ದುಂಡಾದ ಮಾಡಿ
ಉದಾಹರಣೆ: ಮೂಲ ಡೇಟಾವು ಪೂರ್ಣಾಂಕಗಳನ್ನು ಮಾತ್ರ ಹೊಂದಿದ್ದರೆ ಸರಾಸರಿಯನ್ನು 85.6847 ಎಂದು ವರದಿ ಮಾಡಬೇಡಿ
ಸಂಖ್ಯಾಶಾಸ್ತ್ರ ಕ್ಯಾಲ್ಕುಲೇಟರ್ FAQ
ನಾನು ಯಾವಾಗ ಮಾದರಿ vs ಜನಸಂಖ್ಯಾ ಸಂಖ್ಯಾಶಾಸ್ತ್ರಗಳನ್ನು ಬಳಸಬೇಕು?
ನೀವು ಅಧ್ಯಯನ ಮಾಡುತ್ತಿರುವ ಗುಂಪಿನಲ್ಲಿ ಪ್ರತಿಯೊಬ್ಬರೂ ನಿಮ್ಮ ಡೇಟಾದಲ್ಲಿ ಇದ್ದರೆ ಜನಸಂಖ್ಯೆಯನ್ನು ಬಳಸಿ. ನೀವು ದೊಡ್ಡ ಜನಸಂಖ್ಯೆಯ ಉಪಗುಂಪನ್ನು ಪ್ರತಿನಿಧಿಸುವ ಡೇಟಾವನ್ನು ಹೊಂದಿದ್ದರೆ ಮತ್ತು ಅದರ ಬಗ್ಗೆ ತೀರ್ಮಾನಗಳನ್ನು ಮಾಡಲು ಬಯಸಿದರೆ ಮಾದರಿಯನ್ನು ಬಳಸಿ.
ನನ್ನ ಡೇಟಾ ವಕ್ರವಾಗಿದ್ದರೆ ಅದರ ಅರ್ಥವೇನು?
ವಕ್ರ ಡೇಟಾವು ಒಂದು ಬದಿಯಲ್ಲಿ ಉದ್ದವಾದ ಬಾಲವನ್ನು ಹೊಂದಿರುತ್ತದೆ. ಬಲ-ವಕ್ರ (ಧನಾತ್ಮಕ) ಎಂದರೆ ಹೆಚ್ಚಿನ ಮೌಲ್ಯಗಳು ಕಡಿಮೆ ಮತ್ತು ಕೆಲವು ಹೆಚ್ಚಿನ ಮೌಲ್ಯಗಳು ಇವೆ. ಎಡ-ವಕ್ರ (ಋಣಾತ್ಮಕ) ಎಂದರೆ ಹೆಚ್ಚಿನ ಮೌಲ್ಯಗಳು ಹೆಚ್ಚು ಮತ್ತು ಕೆಲವು ಕಡಿಮೆ ಮೌಲ್ಯಗಳು ಇವೆ.
ನನ್ನ ಡೇಟಾದಲ್ಲಿ ಹೊರಗಿನವರನ್ನು ಹೇಗೆ ಗುರುತಿಸುವುದು?
IQR ವಿಧಾನವನ್ನು ಬಳಸಿ: Q1 - 1.5×IQR ಗಿಂತ ಕೆಳಗಿನ ಅಥವಾ Q3 + 1.5×IQR ಗಿಂತ ಮೇಲಿನ ಮೌಲ್ಯಗಳು ಸಂಭಾವ್ಯ ಹೊರಗಿನವರು. ಸರಾಸರಿಯಿಂದ 2-3 ಪ್ರಮಾಣಿತ ವಿಚಲನೆಗಳಿಗಿಂತ ಹೆಚ್ಚಿನ ಮೌಲ್ಯಗಳನ್ನು ಸಹ ಪರಿಶೀಲಿಸಿ.
ನಾನು ಯಾವ ಕೇಂದ್ರ ಪ್ರವೃತ್ತಿಯ ಅಳತೆಯನ್ನು ಬಳಸಬೇಕು?
ಹೊರಗಿನವರಿಲ್ಲದ ಸಮ್ಮಿತೀಯ ಡೇಟಾಗೆ ಸರಾಸರಿಯನ್ನು ಬಳಸಿ, ವಕ್ರ ಡೇಟಾ ಅಥವಾ ಹೊರಗಿನವರನ್ನು ಹೊಂದಿರುವ ಡೇಟಾಗೆ ಮಧ್ಯಮವನ್ನು ಬಳಸಿ, ಮತ್ತು ವರ್ಗೀಕೃತ ಡೇಟಾಗೆ ಅಥವಾ ಅತ್ಯಂತ ಸಾಮಾನ್ಯ ಮೌಲ್ಯಗಳನ್ನು ಕಂಡುಹಿಡಿಯಲು ಬಹುಪದವನ್ನು ಬಳಸಿ.
ವ್ಯತ್ಯಾಸ ಮತ್ತು ಪ್ರಮಾಣಿತ ವಿಚಲನೆಯ ನಡುವಿನ ವ್ಯತ್ಯಾಸವೇನು?
ಪ್ರಮಾಣಿತ ವಿಚಲನೆಯು ವ್ಯತ್ಯಾಸದ ವರ್ಗಮೂಲವಾಗಿದೆ. ವ್ಯತ್ಯಾಸವು ವರ್ಗೀಕೃತ ಘಟಕಗಳಲ್ಲಿದೆ, ಆದರೆ ಪ್ರಮಾಣಿತ ವಿಚಲನೆಯು ನಿಮ್ಮ ಮೂಲ ಡೇಟಾದಂತೆಯೇ ಅದೇ ಘಟಕಗಳಲ್ಲಿದೆ, ಇದು ವ್ಯಾಖ್ಯಾನಿಸಲು ಸುಲಭವಾಗಿಸುತ್ತದೆ.
ವಿಶ್ವಾಸಾರ್ಹ ಸಂಖ್ಯಾಶಾಸ್ತ್ರಗಳಿಗಾಗಿ ನನಗೆ ಎಷ್ಟು ಡೇಟಾ ಬಿಂದುಗಳು ಬೇಕು?
ನೀವು ಯಾವುದೇ ಸಂಖ್ಯೆಯ ಬಿಂದುಗಳೊಂದಿಗೆ ಸಂಖ್ಯಾಶಾಸ್ತ್ರಗಳನ್ನು ಲೆಕ್ಕಹಾಕಬಹುದಾದರೂ, 30+ ನ ಮಾದರಿಗಳನ್ನು ಸಾಮಾನ್ಯವಾಗಿ ಹೆಚ್ಚು ವಿಶ್ವಾಸಾರ್ಹವೆಂದು ಪರಿಗಣಿಸಲಾಗುತ್ತದೆ. ಸರಾಸರಿಯಂತಹ ಕೆಲವು ಸಂಖ್ಯಾಶಾಸ್ತ್ರಗಳಿಗೆ, ಸಣ್ಣ ಮಾದರಿಗಳು ಸಹ ಉಪಯುಕ್ತವಾಗಬಹುದು.
ಪ್ರಮಾಣಿತ ದೋಷವು ನನಗೆ ಏನು ಹೇಳುತ್ತದೆ?
ಪ್ರಮಾಣಿತ ದೋಷವು ನಿಮ್ಮ ಮಾದರಿ ಸರಾಸರಿಯು ನಿಜವಾದ ಜನಸಂಖ್ಯಾ ಸರಾಸರಿಯಿಂದ ಎಷ್ಟು ಭಿನ್ನವಾಗಿರಬಹುದು ಎಂಬುದನ್ನು ಅಂದಾಜು ಮಾಡುತ್ತದೆ. ಸಣ್ಣ ಪ್ರಮಾಣಿತ ದೋಷವು ನಿಮ್ಮ ಮಾದರಿ ಸರಾಸರಿಯು ಜನಸಂಖ್ಯಾ ಸರಾಸರಿಗೆ ಹತ್ತಿರವಾಗಿರುವ ಸಾಧ್ಯತೆಯಿದೆ ಎಂದು ಸೂಚಿಸುತ್ತದೆ.
ನಾನು ವಿವಿಧ ಡೇಟಾಸೆಟ್ಗಳ ನಡುವೆ ಪ್ರಮಾಣಿತ ವಿಚಲನೆಗಳನ್ನು ಹೋಲಿಸಬಹುದೇ?
ಡೇಟಾಸೆಟ್ಗಳು ಒಂದೇ ರೀತಿಯ ಸರಾಸರಿಗಳು ಮತ್ತು ಘಟಕಗಳನ್ನು ಹೊಂದಿದ್ದರೆ ಮಾತ್ರ. ವಿವಿಧ ಮಾಪಕಗಳಿಗೆ, ಸಾಪೇಕ್ಷ ವ್ಯತ್ಯಾಸವನ್ನು ಹೋಲಿಸಲು ಬದಲಾವಣೆಯ ಗುಣಾಂಕವನ್ನು (SD/ಸರಾಸರಿ × 100%) ಬಳಸಿ.
ಸಂಪೂರ್ಣ ಪರಿಕರಗಳ ಡೈರೆಕ್ಟರಿ
UNITS ನಲ್ಲಿ ಲಭ್ಯವಿರುವ ಎಲ್ಲಾ 71 ಪರಿಕರಗಳು