મોટા ડેટામાં અનંત વિકાસની સંભાવના છે. આવો જાણીએ કે બિગ ડેટા શું છે અને તે 2010માં જ લોકપ્રિય થવાના ત્રણ કારણો.


અમુક સમયે, અમે વિવિધ માધ્યમો દ્વારા અજાણ્યા શબ્દ Big Data નો સામનો કરવાનું શરૂ કર્યું. આ શબ્દો પ્રચલિત થયાને થોડાં જ વર્ષો થયાં છે. જો કે, તાજેતરમાં મીડિયા દ્વારા તેનો એટલો વધુ ઉપયોગ કરવામાં આવ્યો છે કે "મોટા ડેટાનો ઉપયોગ કરીને માર્કેટિંગ" જેવા અભિવ્યક્તિઓ હવે અમને કંટાળાજનક લાગે છે. તો મોટા ડેટા અને ડેટા માઇનિંગ વિશે શું છે જે તેમને આટલું લોકપ્રિય બનાવે છે?

મોટા ડેટાનો શાબ્દિક અર્થ થાય છે વિશાળ ડેટા સેટ. કોઈપણ ડેટા કે જેને સ્ટોરેજ માધ્યમમાં સંગ્રહિત કરી શકાય છે, સરળ સંખ્યાઓથી લઈને જટિલ CCTV ઈમેજીસ સુધી, તે ફોર્મેટને ધ્યાનમાં લીધા વિના, સમૂહ બનાવવા માટે એકસાથે ભેગા કરીને મોટો ડેટા બની શકે છે. બીજા શબ્દોમાં કહીએ તો, ડેટાના ઔપચારિક પાસાથી, અગાઉના ડેટા અને મોટા ડેટા વચ્ચે કોઈ તફાવત નથી. જો કે, જો મોટો ડેટા ફક્ત મોટા કદનો ડેટા હોય, તો તે 1990 ના દાયકાના અંતમાં અને 2000 ના દાયકાની શરૂઆતમાં, જ્યારે કમ્પ્યુટર તકનીકનો ઝડપથી વિકાસ થયો હતો તેટલો જ લોકપ્રિય હોવો જોઈએ. જો કે, મોટા ડેટા માત્ર 2010માં જ લોકપ્રિય થવાના ત્રણ કારણો છે:

સૌ પ્રથમ, સૌથી મોટું કારણ CPU ડેવલપમેન્ટમાં પેરાડાઈમ શિફ્ટ છે. CPU (સેન્ટ્રલ પ્રોસેસિંગ યુનિટ) એ કમ્પ્યુટરનું મગજ છે જે કોમ્પ્યુટેશનલ કાર્યો કરે છે. ભૂતકાળમાં, વિકાસની ગતિ એટલી ઝડપી હતી કે મૂરનો કાયદો, જે જણાવે છે કે CPU કામગીરી દર 18 મહિનામાં બમણી થાય છે, તેને વ્યાપકપણે સ્વીકારવામાં આવી હતી. જો કે, 2004 માં, CPU નો વિકાસ '4GHz દિવાલ' તરીકે ઓળખાતી મર્યાદા સુધી પહોંચી ગયો. અગાઉ, CPU વિકાસની દિશા એક કોર (કમ્પ્યુટિંગ એકમ) માં દાખલ કરાયેલા ટ્રાન્ઝિસ્ટર (કમ્પ્યુટિંગ તત્વો) ની સંખ્યા વધારીને એક પ્રોસેસિંગ યુનિટની ઝડપ વધારવાની હતી. જો કે, આ પદ્ધતિમાં ગરમીની ગંભીર સમસ્યા હતી કારણ કે જેમ જેમ ટ્રાન્ઝિસ્ટરનું સંકલન વધતું ગયું તેમ તેમ દરેક ટ્રાન્ઝિસ્ટર માટે ગરમીનું વિસર્જન ક્ષેત્ર ઘટતું ગયું. CPU ઉત્પાદકો આખરે આ હીટિંગ સમસ્યાને ઉકેલવામાં નિષ્ફળ ગયા. પરિણામે, ટ્રાન્ઝિસ્ટર એકીકરણ ચોક્કસ સ્તર કરતાં વધી ગયું ન હતું, અને એક કોરની ઓપરેટિંગ ઝડપ લગભગ 4GHz પર રહી હતી. જો કે, કોરમાં ટ્રાન્ઝિસ્ટરની સંખ્યા વધારવાને બદલે, CPU ઉત્પાદકોએ ગરમીની સમસ્યાનો સામનો કરવા માટે અન્ય માર્ગો શોધી કાઢ્યા છે. મલ્ટિ-કોર CPU વિકસાવીને એક નવી સફળતા મળી જેમાં CPU ની અંદર બહુવિધ કોરોનો સમાવેશ થાય છે. જ્યારે હાલના સિંગલ-કોર CPU એક કોર દ્વારા બહુવિધ કાર્યોની પ્રક્રિયા કરે છે, ત્યારે મલ્ટિ-કોર CPU બહુવિધ કોરોમાં બહુવિધ કાર્યોને વિભાજિત અને સમાંતર કરીને અને એકસાથે પ્રક્રિયા કરીને પ્રક્રિયાની ઝડપમાં વધારો કરે છે. આ મલ્ટી-કોર સીપીયુ વધુને વધુ લોકપ્રિય બન્યા છે, અને સમાંતર કમ્પ્યુટિંગ ટેક્નોલોજી કે જે એકસાથે ડેટા પર પ્રક્રિયા કરે છે તે વિકસિત થઈ છે. પરિણામે, કમ્પ્યુટિંગ ઝડપની મર્યાદાઓને કારણે અગાઉ હેન્ડલ કરી શકાતા ન હતા તેવા વિશાળ પ્રમાણમાં ડેટાને વધુ ઝડપથી અને સરળતાથી હેન્ડલ કરવાનું હવે શક્ય બન્યું છે.

માત્ર મલ્ટી-કોર CPU નું લોકપ્રિયીકરણ જ નહીં, પણ સ્ટોરેજ મીડિયાના વિકાસએ પણ મોટા ડેટાના યુગની શરૂઆત કરવામાં મોટી ભૂમિકા ભજવી હતી. હાર્ડ ડિસ્કના કિસ્સામાં, એક પ્રતિનિધિ સંગ્રહ માધ્યમ, ડેટા મેટલ પ્લેટ્સ પર સંગ્રહિત થાય છે જેને પ્લેટર્સ કહેવાય છે. એક હાર્ડ ડિસ્કમાં બહુવિધ પ્લેટર્સ દાખલ કરવા માટે સુધારેલ ચુંબકીય રેકોર્ડ એકીકરણ અને મલ્ટી-કોર CPUs જેવી તકનીકો વિકસાવવામાં આવી છે. આનો આભાર, સ્ટોરેજ ક્ષમતા વિસ્ફોટક રીતે વધી છે, એટલી હદે કે 2023માં 8TB સ્ટોરેજ સ્પેસ ધરાવતા ઉત્પાદનો લોકપ્રિય બન્યા છે, જે 1990ના દાયકામાં માત્ર 1GB હતી. ઉપરાંત, પ્રમાણમાં ધીમી હાર્ડ ડિસ્કથી વિપરીત, SSD (સોલિડ સ્ટેટ ડ્રાઇવ) જેવા હાઇ સ્પીડ સાથે નવા સ્ટોરેજ મીડિયા ઉભરી આવ્યા છે. મોટી માત્રામાં ડેટાનો ઉપયોગ કરવો સરળ બની ગયો છે જે અગાઉ અપૂરતી સ્ટોરેજ સ્પેસને કારણે સ્ટોર કરી શકાતો ન હતો અથવા સ્ટોર કરવામાં આવે તો પણ વાંચન અને લખવાની ધીમી ગતિને કારણે પ્રક્રિયા કરવી મુશ્કેલ હતી.

CPU અને સ્ટોરેજ મીડિયામાં એડવાન્સિસે મોટી માત્રામાં ડેટાનો ઉપયોગ કરવાનું શક્ય બનાવ્યું છે જેની અગાઉ ગણતરી અથવા સંગ્રહ કરી શકાતો ન હતો. જો કે, આજના મોટા ડેટા અને ભૂતકાળના મોટા ડેટા વચ્ચેનો મૂળભૂત તફાવત ડેટા એકત્રિત કરવાની રીતમાં રહેલો છે. સ્માર્ટ ઉપકરણો અને એસએનએસ, જે 2010 ના દાયકામાં ઝડપથી લોકપ્રિય બન્યા હતા, તેણે ડેટા સંગ્રહના નમૂનાને બદલી નાખ્યો. નેટવર્ક સાથે પ્રત્યક્ષ કે પરોક્ષ રીતે જોડાયેલા સ્માર્ટ ઉપકરણો કેમેરા, GPS (ગ્લોબલ પોઝિશનિંગ સિસ્ટમ) અને NFC (નિયર ફિલ્ડ કોમ્યુનિકેશન) જેવા વિવિધ સેન્સર દ્વારા વપરાશકર્તાનો ડેટા એકત્રિત કરે છે. અને આ ડેટા સતત નેટવર્ક પર અપલોડ થઈ રહ્યો છે. વધુમાં, ફેસબુક અને ટ્વિટર જેવા SNS ના વપરાશકર્તાઓ સતત તેમની વિવિધ વ્યક્તિગત માહિતી નેટવર્ક પર અપલોડ કરી રહ્યા છે. ભૂતકાળમાં, ડેટા એકત્રીકરણ માત્ર ચોક્કસ લક્ષ્ય ડેટા મેળવવા માટે કરવામાં આવતું હતું જે ડેટા સંગ્રહનો વિષય મહત્વપૂર્ણ માનવામાં આવતો હતો. જો કે, વર્તમાન ડેટા સંગ્રહ આડેધડ રીતે સ્માર્ટ ઉપકરણો અને SNS દ્વારા નેટવર્કમાંથી વહેતા મોટા પ્રમાણમાં ડેટા એકત્રિત કરે છે. વધુમાં, જેમ જેમ નેટવર્ક ટેક્નોલોજીનો ધીમે ધીમે વિકાસ થતો જાય છે તેમ તેમ નેટવર્ક સાથે જોડાયેલા પદાર્થોના પ્રકારો વધી રહ્યા છે. બીજા શબ્દોમાં કહીએ તો, ઇન્ટરનેટ ઓફ થિંગ્સ (IOT) ના આગમન સાથે, ડેટા સંગ્રહનો વિસ્તાર વધુ વિસ્તરી રહ્યો છે.

આ રીતે, મલ્ટી-કોર સીપીયુના વિકાસ, સ્ટોરેજ મીડિયાના વિકાસ અને ડેટા સંગ્રહના અવકાશના વિસ્તરણના સુમેળભર્યા સંયોજન દ્વારા મોટા ડેટાનો ખ્યાલ ઉભરી આવ્યો. હાલમાં, અસંખ્ય કંપનીઓ, સરકારો અને અન્ય જૂથો ખજાનો શોધવા માટે તેઓએ એકત્રિત કરેલા મોટા ડેટામાં ખોદકામ કરી રહ્યા છે, અને વિવિધ માધ્યમો મોટા ડેટાના મહત્વ પર ભાર મૂકે છે. પરંતુ કંઈપણ કરતાં વધુ, આપણે મોટા ડેટા વિશે જે ધ્યાનમાં લેવાની જરૂર છે તે એ છે કે વર્તમાન મોટા ડેટા માત્ર શરૂઆત છે. ભવિષ્યમાં, મલ્ટી-કોર સીપીયુ એકસાથે ઝડપી ગણતરીઓ કરવા માટે સક્ષમ બનવા માટે વિકસિત થશે, અને સ્ટોરેજ મીડિયા વધુ ઝડપથી વધુ ડેટા સ્ટોર કરવા માટે સક્ષમ બનવા માટે વિકસિત થશે. અને વધુ ને વધુ વસ્તુઓ નેટવર્ક સાથે કનેક્ટ થશે અને તેઓએ એકત્રિત કરેલ ડેટા નેટવર્ક પર મોકલશે. વર્તમાન બિગ ડેટા કે જેને આપણે હાલમાં મોટા ગણીએ છીએ તે બિગ ડેટાના આવનારા યુગમાં બિલકુલ મોટો નહીં હોય.