Veri depolama

Veri Ambarlama Nedir?

Veri depolama, büyük miktarda bilginin bir işletme veya kuruluş tarafından elektronik olarak depolanmasıdır. Veri ambarı, iş verileri üzerinde analitik teknikleri kullanan iş zekasının hayati bir bileşenidir.

Veri ambarı kavramı, 1988’de IBM araştırmacıları Barry Devlin ve Paul Murphy tarafından tanıtıldı. Bilgisayar sistemleri daha karmaşık hale geldikçe ve artan miktarda veriyi işledikçe veri depolama ihtiyacı gelişti. Veri ambarı ile ilgili önemli bir kitap, WH Inmon’un ilk olarak 1990’da yayınlanan ve o zamandan beri birkaç kez yeniden basılan “Veri Ambarını Oluşturmak” adlı kitabıdır.

Veri Ambarlama Nasıl Çalışır?

Veri ambarı, birden çok heterojen kaynaktan konsolide edilen verileri karşılaştırarak bir şirketin performansı hakkında daha fazla bilgi sağlamak için kullanılır. Bir veri ambarı, işlem kaynaklarından türetilen geçmiş veriler üzerinde sorgu ve analiz çalıştırmak için tasarlanmıştır.

Veriler ambarla birleştirildikten sonra değişmez ve değiştirilemez, çünkü bir veri ambarı, zaman içinde verilerdeki değişikliklere odaklanarak halihazırda meydana gelen olaylar üzerinde analitik çalıştırır. Depolanan veriler güvenli, güvenilir, geri getirilmesi ve yönetilmesi kolay bir şekilde depolanmalıdır.

Bir veri ambarı oluşturmak için atılan belirli adımlar vardır. İlk adım, birden çok kaynak noktasından büyük miktarda veri toplamayı içeren veri çıkarma işlemidir. Veriler derlendikten sonra, veri temizleme, verilerde hatalar için tarama ve bulunan hataları düzeltme veya hariç tutma sürecinden geçer.

Temizlenen veriler daha sonra bir veritabanı formatından bir depo formatına dönüştürülür. Depoda depolandıktan sonra veriler, daha koordineli ve kullanımı daha kolay olması için sıralama, konsolide etme, özetleme vb. İşlemlerden geçer. Zamanla, birden çok veri kaynağı güncellendiği için depoya daha fazla veri eklenir.

Temel Çıkarımlar

  • Veri depolama, büyük miktarda bilginin bir işletme veya kuruluş tarafından elektronik olarak depolanmasıdır.
  • Bir veri ambarı, iş zekası ve veri madenciliği amacıyla işlem kaynaklarından türetilen geçmiş veriler üzerinde sorgu ve analiz çalıştırmak için tasarlanmıştır.
  • Veri ambarı, birden çok heterojen kaynaktan konsolide edilen verileri karşılaştırarak bir şirketin performansı hakkında daha fazla bilgi sağlamak için kullanılır.

Özel Hususlar: Veri Madenciliği

İşletmeler, keşif ve veri madenciliğinde kullanılmak üzere veri depolayabilir ve iş süreçlerini iyileştirmelerine yardımcı olacak bilgi kalıpları arayabilirler. İyi bir veri depolama sistemi, bir şirket içindeki farklı departmanların birbirlerinin verilerine erişmesini de kolaylaştırabilir.

 

Örneğin, bir veri ambarı, bir şirketin satış ekibinin verilerini kolayca değerlendirmesine olanak tanıyabilir ve satışları nasıl iyileştireceği veya departmanı nasıl kolaylaştıracağı konusunda kararlar almasına yardımcı olabilir. İşletme, ürünlerini daha iyi konumlandırmak ve satışları artırmak için müşterilerinin harcama alışkanlıklarına odaklanmayı seçebilir.

Şirket, veri ambarlama ile müşterilerinin geçmişte (örneğin 20 yıl) harcamalarına ilişkin geçmiş verileri toplayabilir ve bu veriler üzerinde analitik çalıştırabilir. Ortaya çıkan bilgiler, tüketicilerinin tercihleri ​​hakkında fikir verebilir; satışların arttığı günün, ayın veya yılın zamanı; veya yıl için en yüksek harcama yapan müşteri.

Etkili veri depolama ve yönetimi, seyahat rezervasyonlarını başlatmak ve otomatik para çekme makinelerini kullanmak gibi süreçleri de mümkün kılan şeydir.

Veri madenciliği süreci beş adıma ayrılır:

  1. Kuruluşlar verileri toplar ve veri ambarlarına yükler.
  2. Daha sonra verileri şirket içi sunucularda veya bulutta depolar ve yönetirler.
  3. İş analistleri, yönetim ekipleri ve bilgi teknolojisi uzmanları verilere erişir ve bunları nasıl düzenlemek istediklerini belirler.
  4. Uygulama yazılımı daha sonra verileri kullanıcının sonuçlarına göre sıralar
  5. Son kullanıcı, verileri grafik veya tablo gibi paylaşması kolay bir formatta sunar.

Veri Ambarı ve Veritabanları

Bir veri ambarı, standart bir veritabanı ile aynı kavram olmak zorunda değildir. Veritabanı, yalnızca en son verileri elde etmek için gerçek zamanlı verileri izlemek ve güncellemek üzere ayarlanmış bir işlem sistemidir. Bir veri ambarı, yapılandırılmış verileri belirli bir süre boyunca toplamak için programlanır. Örneğin, bir veritabanı bir müşterinin yalnızca en son adresine sahip olabilirken, bir veri ambarı, müşterinin son 10 yıldır içinde yaşadığı tüm adreslere sahip olabilir.