Setiap hari organisasi besar mengemas kini dengan teknologi yang memudahkan dan lebih sesuai dengan setiap syarikat, menghadapi cabaran besar yang membolehkan mereka menemui dan menganalisis di luar alat yang digunakan setiap hari, bagi mereka ia diciptakan apa yang dikenali sebagai Big Data atau data besar-besaran Sepanyol, yang merupakan sistem penyimpanan data berskala besar.
Fenomena penyimpanan ini dibingkai dalam teknologi maklumat dan komunikasi baru. Big Data adalah apa yang merangkumi semua aktiviti yang berkaitan dengan sistem yang menyimpan sejumlah besar data. Salah satu ciri utama ialah ia memanipulasi sejumlah besar maklumat, mengumpulkan, mengklasifikasikan dan kemudian menyimpannya. Tujuan koleksi ini adalah untuk membuat laporan statistik untuk penggunaan organisasi, baik sebagai analisis rancangan perniagaan, iklan, pengintipan, antara lain.
Margin penyimpanan telah meningkat selama bertahun-tahun, sejak tahun 2008 tahap penyimpanan diukur dalam petabyte hingga zettabyte data. Pakar secara berkala mencari langkah penyimpanan baru kerana ada bidang tertentu di mana sejumlah besar data harus disimpan dan program yang ada tidak begitu optimum.
Terdapat ribuan alat untuk menjalankan dan mengurus Big Data, namun tidak semuanya sama, ada tiga jenis Datas, yaitu:
- Data Berstruktur: adalah data di mana data mempunyai struktur yang sangat khusus, seperti tarikh, nombor, antara lain. Contohnya ialah hamparan.
- Data tidak terstruktur: biasanya data yang memiliki format tertentu dan tidak dapat disimpan dalam spreadsheet, apalagi memanipulasi maklumat, contoh dokumen PDF.
- Data separa berstruktur: jenis data ini tidak mempunyai format tertentu, kerana mempunyai metadata separa berstruktur sendiri, contohnya adalah kod HTML.