Deduplikasi Data di Windows Server 2012

Windows Server 2012 memperkenalkan fitur baru Data Deduplikasi (Deduplikasi Data). Apa itu deduplikasi?? Deduplikasi data secara umum, ini adalah prosedur untuk menemukan dan menghapus data duplikat pada media penyimpanan tanpa mengurangi integritas informasi. Tujuan duplikasi adalah untuk menyimpan informasi dalam blok kecil (32-128 Kb), mengidentifikasi yang sama (blok duplikat) dan menyimpan hanya satu salinan untuk setiap blok, dan mengganti blok duplikat dengan tautan ke satu salinan..

Sebelumnya, perlu menggunakan produk pihak ketiga untuk mengatur deduplikasi (ada solusi deduplikasi perangkat keras pada level array disk, dan perangkat lunak pada level file). Biaya solusi semacam itu cukup tinggi, karena terutama ditujukan untuk pelanggan korporat kaya. Sekarang fitur ini benar-benar gratis untuk semua pengguna Windows Server 2012.

Ada peretasan kecil yang memungkinkan Anda mengaktifkan deduplikasi di sistem operasi klien (Windows 8 dan Windows 8.1). Detail dalam artikel: Cara mengaktifkan deduplikasi data di Windows 8.1

Di Windows Server 2012, deduplikasi diimplementasikan sebagai dua komponen:

  • Driver filter, yang mengontrol fungsi input / output
  • Layanan Deduplikasi - mengendalikan tiga operasi ("Pengumpulan sampah", "Optimasi" dan "Pembersihan").

Komponen-komponen ini bertanggung jawab untuk menemukan data yang cocok, mengatur penyimpanannya dalam bentuk tunggal dan menyediakan akses yang benar kepada mereka.

Sebelumnya, deduplikasi dalam produk Microsoft ditemukan di server mail Exchange 200/2003/2007 - dalam komponen Penyimpanan Instance Tunggal (hanya satu salinan pesan disimpan di server di kotak surat salah satu penerima, dan sisanya dari penerima hanya menerima tautan ke sana).

Deduplikasi data di Windows Server 2012 berjalan di latar belakang dan dimulai secara default setiap jam. Proses dimulai ketika server memuat rendah dan tidak mengurangi kinerja server secara keseluruhan. Selain itu, secara default, file yang belum diakses selama lebih dari 30 hari akan dideduplikasi. Selain itu, prosedur ini tidak dilakukan untuk jenis file berikut: aac, aif, aiff, asf, ASX, au, avi, flac, jpeg, m3kamu, pertengahan, midi, mov, mp1, mp2, mp3, mp4, mpa, mpe, mpeg, mpeg2, mpeg3, mpg, ogg, qt, qtw, ram, rm, rmi, rmvb, snd, swf, vob, wav, lilin, wma, wmv, wvx, accdb, accde, accdr, accdt, docm, docx, dotm, dotx, pptm, potm, potx, ppam, ppsx, pptx, sldx, sldm, thmx, xlsx, xlsm, xltx, xltm, xlsb, xlam, xll, kartu as, busur, arj, bhx, b2, taksi, gz, gzip, hpk, hqx, kendi, lha, lzh, lzx, pak, lubang, rar, laut, duduk, sqz, tgz, kamu, kamu, z, zip, kebun binatang.

Fungsionalitas manajemen deduplikasi tersedia dari GUI dan melalui PowerShell. Pertimbangkan kedua opsi tersebut.

GUI Deduplikasi Data Windows Server 2012

Untuk mengaktifkan deduplikasi data, Anda perlu menginstal komponen Data Deduplicaion peran Layanan File dan Penyimpanan. Anda dapat melakukan ini dari konsol Server Manahger.

Setelah pemasangan komponen selesai, buka Server manager -> File dan Storage Servcies -> Volume -> konsol dan klik kanan pada bagian di mana Anda ingin mengaktifkan deduplikasi dan pilih Konfigurasikan Deduplikasi Data.

Di jendela berikutnya, centang "Aktifkan deduplikasi data". Di sini Anda dapat menentukan direktori yang tidak perlu dideduplikasi dan pengaturan penjadwal deduplikasi.

Tingkat deduplikasi saat ini akan ditampilkan di kolom. Deduplikasi Beri peringkat (diperbarui dalam beberapa jam).

Untuk menganalisis penggunaan ruang disk dan kemungkinan penghematan dari mengaktifkan deduplikasi untuk volume ini, sebuah utilitas telah dikembangkan DDPEVAL.exe. Anda dapat memperkirakan berapa banyak ruang disk yang dapat Anda hemat setelah mengaktifkan deduplikasi data menggunakan perintah berikut (perhatikan bahwa untuk volume besar itu dapat membuat beban signifikan pada CPU)

c: \ windows \ system32 \ ddpeval.exe e: \

Dalam kasus saya, penghematan akan menjadi sekitar 57%.

Deduplikasi Powershell

Proses deduplikasi juga dapat dikontrol dari Powershell. Untuk melakukan ini, instal fungsi Deduplikasi Data menggunakan perintah:

ServerManager Impor-Modul
Add-WindowsFeature -name FS-Data-Deduplication
Deduplikasi Modul Impor

Setelah fungsi deduplikasi diaktifkan, itu harus dikonfigurasi. Untuk mengaktifkan deduplikasi untuk drive D:, jalankan perintah:

Aktifkan-DedupVolume D:

Secara default, file yang tidak dapat diakses (Akses Terakhir) selama lebih dari 30 hari dideduplikasi. Nilai ini dapat diubah, misalnya, selama 2 hari, untuk melakukan ini, jalankan perintah:

Set-DedupVolume D: -MinimumFileAgeDays 2

Biasanya, proses deduplikasi dimulai oleh Windows scheduler, tetapi juga dapat dimulai secara manual:

Start-DedupJob D: -Type Optimization

Statistik saat ini dapat dilihat menggunakan perintah:

Dapatkan-DedupStatus

Daftar tugas saat ini dapat ditemukan menggunakan perintah:

Dapatkan-DedupJob

Semua hasil untuk volume dapat ditampilkan dengan perintah PoSH:

Dapatkan-DedupMetadata -Volume D:

Dan akhirnya, Anda dapat sepenuhnya membatalkan deduplikasi untuk volume dengan perintah:

Start-DedupJob -Volume D: -Type Unoptimization

Tangkapan layar di bawah ini menunjukkan bahwa setelah mengaktifkan deduplikasi pada drive E: (untuk pengujian saya memasukkan 4 dari ISO yang sama dengan Windows 8), ukuran ruang disk yang digunakan menurun dari 12 GB menjadi 3 GB.

Layanan deduplikasi menyimpan basis datanya dan potongan yang diduplikasi di direktori Informasi Volume Sistem. Karena itu, Anda tidak boleh campur tangan secara manual dalam strukturnya.

Praktik Terbaik untuk Menggunakan Deduplikasi Data di Windows Server 2012

Microsoft telah menerbitkan hasil studi berikut tentang efektivitas duplikasi berbagai tipe data.

Tipe dataKemungkinan penghematan ruang
Data umum50-60%
Documents30-50%
Perpustakaan aplikasi70-80%
Perpustakaan VHD (X)80-95%

Fitur Utama dari Deduplikasi Data di Windows Server 2012:

  • Ini hanya berfungsi pada volume NTFS dan tidak mendukung sistem file ReFS.
  • Tidak didukung untuk volume boot dan sistem
  • Tidak bekerja dengan file NTFS terkompresi dan terenkripsi
  • Mendukung caching dan BITS
  • Tidak mendukung file kurang dari 32KB
  • Tidak dikonfigurasi melalui kebijakan grup
  • Tidak mendukung Volume yang Dibagikan Cluster
  • Deduplikasi - prosesnya tidak instan dan membutuhkan waktu