ಟಿ. ಜಿ. ಶ್ರೀನಿಧಿ ಹೊಸ ಪುಸ್ತಕ: 'ಟೆಕ್ಸ್ಟ್‌ಬುಕ್ ಅಲ್ಲ, ಇದು ಟೆಕ್ ಬುಕ್!'

ಶುಕ್ರವಾರ, ಅಕ್ಟೋಬರ್ 4, 2013

ಬಿಗ್ ಡೇಟಾ ಬಗ್ಗೆ...

ಟಿ ಜಿ ಶ್ರೀನಿಧಿ

ಡೇಟಾ ಅಥವಾ ದತ್ತಾಂಶ ಎಂದತಕ್ಷಣ ನಮಗೆ ಹಲವಾರು ಸಂಗತಿಗಳು ನೆನಪಾಗುತ್ತವೆ. ಕಳೆದ ಒಂದು ವರ್ಷದಲ್ಲಿ ನಮ್ಮ ದೇಹದ ತೂಕ, ಆರು ತಿಂಗಳಿನಿಂದೀಚೆಗೆ ಮೊಬೈಲ್ ರೀಚಾರ್ಜಿಗೆ ಖರ್ಚುಮಾಡಿದ ಹಣ, ಪರೀಕ್ಷೆಯಲ್ಲಿ ಪಡೆದ ಅಂಕಗಳು, ಪಾಕೆಟ್ ಮನಿ ಖರ್ಚಿನ ಲೆಕ್ಕ - ಹೀಗೆ ಒಂದಲ್ಲ ಒಂದು ಬಗೆಯ ದತ್ತಾಂಶ ನಮ್ಮನ್ನು ಸದಾ ಆವರಿಸಿಕೊಂಡಿರುತ್ತದಲ್ಲ!

ವೈಯಕ್ತಿಕ ವಿಷಯ ಹಾಗಿರಲಿ, ಸಣ್ಣ-ದೊಡ್ಡ ಸಂಸ್ಥೆಗಳಲ್ಲೂ ದತ್ತಾಂಶದ್ದೇ ಭರಾಟೆ. ಕಳೆದ ವರ್ಷದ ಲಾಭ-ನಷ್ಟ, ಮೂರುತಿಂಗಳಿನಲ್ಲಿ ಮಾರಾಟವಾದ ಉತ್ಪನ್ನಗಳ ಲೆಕ್ಕಾಚಾರ, ಶೇರು ಬೆಲೆಯ ಏರಿಳಿತ, ಉದ್ಯೋಗಿಗಳ ಬಗೆಗಿನ ವಿವರ - ಹೀಗೆ ಅಲ್ಲೂ ಭಾರೀ ಪ್ರಮಾಣದಲ್ಲಿ ದತ್ತಾಂಶದ ಶೇಖರಣೆ ನಡೆದಿರುತ್ತದೆ. ಕಂಪ್ಯೂಟರುಗಳು-ಅವುಗಳಲ್ಲಿನ ಡೇಟಾಬೇಸುಗಳೆಲ್ಲ ಇಂತಹ ದತ್ತಾಂಶದ ಸಂಗ್ರಹದಿಂದ ತುಂಬಿ ತುಳುಕುತ್ತಿರುತ್ತವೆ ಎಂದರೂ ಸರಿಯೇ!

ಬಹಳ ವರ್ಷಗಳಿಂದ ಕಂಪ್ಯೂಟರ್ ಪ್ರಪಂಚ ಬೆಳೆದುಬಂದಿರುವುದೂ ಹೀಗೆಯೇ. ಇದರಿಂದಾಗಿ ದತ್ತಾಂಶದ ಸಂಗ್ರಹ ಎಂದಾಕ್ಷಣ ಅದು ಯಾವುದೋ ಒಂದು ದತ್ತಸಂಚಯ, ಅಂದರೆ ಡೇಟಾಬೇಸ್‌ನಲ್ಲೇ ಆಗಿರಬೇಕು ಎನ್ನುವ ಅಭಿಪ್ರಾಯವೇ ಇನ್ನೂ ವ್ಯಾಪಕವಾಗಿದೆ.

ಆದರೆ ಕಂಪ್ಯೂಟರುಗಳು-ಅವುಗಳ ಜಾಲಗಳು ನಮ್ಮ ಬದುಕನ್ನು ಆವರಿಸಿಕೊಳ್ಳುತ್ತಹೋದಂತೆ ದತ್ತಾಂಶದ ಸಂಗ್ರಹವೂ ಅದೆಷ್ಟು ಪ್ರಮಾಣದಲ್ಲಿ ಹೆಚ್ಚಿದೆಯೆಂದರೆ ಅದು ಡೇಟಾಬೇಸ್‌ಗಳ ಮಿತಿಯನ್ನೆಲ್ಲ ಮೀರಿ ಬೆಳೆದುಬಿಟ್ಟಿದೆ. ಹೀಗಾಗಿಯೇ ಈಗ ದತ್ತಾಂಶವೆಂದರೆ ಡೇಟಾಬೇಸಿನ ಟೇಬಲ್ಲುಗಳು - ಅವುಗಳ ನಡುವಿನ ಸಂಬಂಧ (ರಿಲೇಶನ್) ಇಷ್ಟೇ ಅಲ್ಲ. ಪಠ್ಯ, ಧ್ವನಿ, ಚಿತ್ರ, ವೀಡಿಯೋಗಳೊಡನೆ ಶುರುವಾಗುವ ದತ್ತಾಂಶದ ಪಟ್ಟಿ, ಸರ್ಚ್ ಇಂಜನ್ ಹುಡುಕಾಟಗಳು, ಸಮಾಜಜಾಲಗಳಲ್ಲಿ ಹರಿದಾಡುವ ಸಂದೇಶಗಳು, ಆನ್‌ಲೈನ್ ಅಂಗಡಿಗಳಲ್ಲಿ ಮಾರಾಟವಾಗುವ ಸರಕುಗಳು - ಹೀಗೆ ಹಲವಾರು ಹೊಸ ಮೂಲಗಳನ್ನು ತನ್ನಲ್ಲಿ ಸೇರಿಸಿಕೊಳ್ಳುತ್ತಿದೆ. ದತ್ತಾಂಶ ನಿರ್ದಿಷ್ಟ ರೂಪದಲ್ಲಷ್ಟೆ ಇರಬೇಕು ಎನ್ನುವ ಅಘೋಷಿತ ನಿಯಮ ಕೂಡ ದೂರವಾಗುತ್ತಿದೆ.

ಹೀಗಿರುವಾಗ ಸಹಜವಾಗಿಯೇ ದತ್ತಾಂಶದ ಪ್ರಮಾಣದಲ್ಲೂ ಗಮನಾರ್ಹ ಪ್ರಮಾಣದ ಏರಿಕೆ ಕಂಡುಬಂದಿದೆ. ಗಿಗಾಬೈಟುಗಳ ಲೆಕ್ಕವೆಲ್ಲ ಹಳೆಯದಾಗಿ ದತ್ತಾಂಶದ ಪ್ರಮಾಣವನ್ನು ಇದೀಗ ಪೆಟಾಬೈಟ್-ಎಕ್ಸಾಬೈಟುಗಳಲ್ಲಿ ಅಳೆಯಲಾಗುತ್ತಿದೆ (ಒಂದು ಪೆಟಾಬೈಟ್ ಎನ್ನುವುದು ಹತ್ತು ಲಕ್ಷ ಗಿಗಾಬೈಟ್‌ಗಳಿಗೆ ಸಮ; ಎಕ್ಸಾಬೈಟ್ ಎಂದರೆ ಸಾವಿರ ಪೆಟಾಬೈಟ್). ಮಾಹಿತಿ ತಂತ್ರಜ್ಞಾನ ಪ್ರಪಂಚದಲ್ಲಿ ಬಿಗ್ ಡೇಟಾ ಎಂದು ಗುರುತಿಸುವುದು ಇದನ್ನೇ.

ಇಷ್ಟಕ್ಕೂ ಈ 'ಬಿಗ್ ಡೇಟಾ' ಎಂದರೇನು? ಈ ಪ್ರಶ್ನೆಗೆ ಉತ್ತರಿಸಲು ತಜ್ಞರು ಕೆಲವು ಪ್ರಮುಖ ಅಂಶಗಳನ್ನು ಬಳಸುತ್ತಾರೆ. 'ವಾಲ್ಯೂಮ್, ವೆರೈಟಿ ಹಾಗೂ ವೆಲಾಸಿಟಿ' ಎಂಬ ಈ ಮೂರು ಅಂಶಗಳು '೩ವಿ'ಗಳೆಂದೇ ಪ್ರಸಿದ್ಧವಾಗಿವೆ.

ಇವುಗಳಲ್ಲಿ ಮೊದಲನೆಯದು ವಾಲ್ಯೂಮ್, ಅಂದರೆ ದತ್ತಾಂಶದ ಪ್ರಮಾಣ. ಪೆಟಾಬೈಟ್-ಎಕ್ಸಾಬೈಟುಗಳ ಉದಾಹರಣೆಯಲ್ಲಿ ಹೇಳಿದಂತೆ ಬೃಹತ್ ಪ್ರಮಾಣದ ಮಾಹಿತಿಯಷ್ಟೆ ಬಿಗ್ ಡೇಟಾ ಎಂದು ಕರೆಸಿಕೊಳ್ಳಬಲ್ಲದು.

ಎರಡನೆಯ ಅಂಶ ವೆರೈಟಿ, ಅಂದರೆ ದತ್ತಾಂಶದ ವೈವಿಧ್ಯ. ದತ್ತಸಂಚಯಗಳಲ್ಲಿರುವಂತಹ ಸಾಮಾನ್ಯ ದತ್ತಾಂಶವನ್ನು ಮೀರಿದ ವಿಧಗಳಷ್ಟೇ ಬಿಗ್‌ಡೇಟಾ ಎಂಬ ಹಣೆಪಟ್ಟಿಗೆ ಅರ್ಹವಾಗುತ್ತವೆ. ಹೀಗಾಗಿಯೇ ವಿವಿಧ ಮೂಲಗಳಿಂದ ಸೃಷ್ಟಿಯಾಗುವ, ವಿವಿಧೆಡೆ ವಿವಿಧ ರೂಪಗಳಲ್ಲಿ ಅಸ್ತಿತ್ವದಲ್ಲಿರುವ ದತ್ತಾಂಶವೆಲ್ಲ ಬಿಗ್‌ಡೇಟಾ ಪರಿಧಿಗೆ ಬರುತ್ತದೆ.

ಮೂರನೆಯ ಅಂಶ ದತ್ತಾಂಶ ಸೃಷ್ಟಿಯಾಗುವ ವೇಗ. ಸಮಾಜ ಜಾಲಗಳಲ್ಲಿ ಹರಿದುಬರುವ ಸಂದೇಶಗಳು, ಸರ್ಚ್ ಇಂಜನ್‌ನಲ್ಲಿ ಹುಡುಕಲಾಗುವ ವಿಷಯಗಳು - ಇವೆಲ್ಲ ಕ್ಷಣಕ್ಷಣಕ್ಕೂ ಬೆಳೆಯುತ್ತಲೇ ಇರುತ್ತವಲ್ಲ, ಹಾಗಾಗಿ ಅವೂ ಬಿಗ್ ಡೇಟಾ ಎಂದು ಕರೆಸಿಕೊಳ್ಳುತ್ತವೆ.

ಈ ಮೂರು ಅಂಶಗಳ ನೆರವಿನಿಂದ ಬಿಗ್ ಡೇಟಾ ಪದದ ಅರ್ಥವಿವರಣೆಯೇನೋ ಸಿಕ್ಕಿಬಿಡುತ್ತದೆ ನಿಜ. ಆದರೆ ಬಿಗ್ ಡೇಟಾ ಉಪಯೋಗ ಏನು, ಮತ್ತು ಅದರ ವಿಶ್ಲೇಷಣೆಯಿಂದ ಉಪಯುಕ್ತ ಮಾಹಿತಿ ಪಡೆದುಕೊಳ್ಳುವುದು ಹೇಗೆ? ಮುಂದಿನ ವಾರ ನೋಡೋಣ.

ಅಕ್ಟೋಬರ್ ೪, ೨೦೧೩ರ ಉದಯವಾಣಿಯಲ್ಲಿ ಪ್ರಕಟವಾದ ಲೇಖನ
badge