Sơ đồ quy trình quản lí dữ liệu của TIME Studio

Quy trình khai thác và quản lí dữ liệu 2020

Anh có một nỗi ám ảnh mang tên MẤT ẢNH. Số là có một lần anh bị hỏng mất chiếc máy tính xách tay có ảnh chụp con trai ngay trong phòng sinh. Rồi có lần lại bị hỏng chiếc ổ cứng 1TB chứa đầy ảnh.

Cả hai lần đó anh đều không có bản sao lưu nào. Thật may là anh vẫn còn một bản nhỏ xíu của bức ảnh con trai. Còn chiếc ổ cứng kia thì cũng khôi phục được phần lớn.

Từ đó, hầu như mọi bức ảnh mà anh chụp đều có ít nhất một bản sao. Thậm chí là ngay khi chụp anh đã để chế độ ghi song song lên cả hai thẻ. Có lần anh quên thẻ SD, chỉ chụp với thẻ CF mà cứ lo ngay ngáy cả buổi.

Còn nếu chụp tether thì anh sẽ dùng Sync Folder Pro để đồng bộ dữ liệu với một ổ cứng di động.

Giải pháp sao lưu 3-2-1

Năm ngoái anh đã viết một bài dài trên paratime.vn về giải pháp này:

  • Có ít nhất 3 bản của cùng một dữ liệu
  • Sao lưu ở 2 loại thiết bị lưu trữ khác nhau
  • Giữ ít nhất 1 bản sao nằm ở địa điểm khác

So với năm ngoái thì năm nay quy trình của anh đã có một số thay đổi.

Quy trình quản lí dữ liệu, phiên bản 2020

Quy trình này gồm 4 bước, trong đó 2 bước đầu được thực hiện hàng ngày. Bước 3 làm hàng tháng. Còn bước 4 thì khoảng một năm.

Bước 1: Nhập ảnh

Anh có một ổ cứng trong dùng riêng cho việc lưu ảnh mới chụp (ổ “DATA” có dung lượng 1TB). Khi nhập ảnh bằng Lightroom, ảnh sẽ được lưu vào ổ DATA và một bản sao ở ổ cứng gắn ngoài (hiện tại là ổ “2019” có dung lượng 4TB được gắn trên một cái dock Sharkoon).

Ảnh được chép vào ổ DATA và tạo một bản sao ở ổ 2019

Với những dự án kéo dài, để chắc ăn thì anh sẽ chép luôn một bản sang NAS và thêm một bản nữa lên Google Drive hoặc Amazon Glacier.

Như vậy, dữ liệu đã có ít nhất hai bản trên hai ổ cứng khác nhau.

Bước 2: Xử lí hậu kì và bàn giao

Ảnh sau khi chép xong thì anh xử lí trên ổ DATA. Những ảnh được chọn và xử lí sẽ được xuất ra dạng JPEG và đưa lên Google Drive hoặc kho ảnh photos.timestudio.vn (dịch vụ của Smugmug) để bàn giao cho khách hàng. Với một số hợp đồng thì anh sẽ xuất tất cả ảnh đã chụp chứ không riêng gì những ảnh đã chọn.

Nếu là ảnh sự kiện thì sau khi thanh lí hợp đồng hoặc trước khi thực hiện bước 3, anh sẽ xoá khỏi ổ DATA những ảnh không được chọn. Bởi nếu không xoá thì tiền chụp không bù được tiền ổ cứng mới :p

Bước 3: Đồng bộ các bản sao

Vào đầu tháng mới, anh chép trong tháng trước từ ổ DATA sang ổ 2019. Dữ liệu này sẽ được tổ chức theo đúng cấu trúc thư mục mà anh đã dùng được hơn chục năm nay:

yyyy/mm/yyyy-mm-dd – Tên sự kiện

Vì ở bước 2 thì DATA có nhiều ảnh bị xoá hoặc đổi tên hoặc chuyển sang các thư mục khác nên cách đồng bộ chính xác nhất là chép từ DATA sang 2019.

Những dữ liệu này cũng được chép lên NAS.

Những bản sao trên 2019 có ở bước 1 chỉ dùng đến khi ổ DATA gặp sự cố. Và đến đây thì có thể xoá được rồi.

Tiếp theo, anh cũng xoá khỏi DATA những dữ liệu đã đồng bộ với ổ 2019. Lúc này Lightroom sẽ thông báo có Missing folder ở ổ DATA, nhưng anh chỉ việc trỏ lại thư mục ở ổ 2019 là mọi chuyện lại ổn.

Bước 4: Mua ổ cứng mới

Khi dung lượng ổ 2019 quá 90% (có lẽ chỉ vài tuần nữa) thì anh tháo nó ra khỏi dock và cất vào tủ chống ẩm sau khi đã tiết kiệm đủ tiền để mua ổ mới 2020 (chắc vẫn là WD Red 4TB hoặc 6TB).

Khi ổ 2019 được tháo ra khỏi dock thì Lightroom sẽ báo thư mục mất tích và anh sẽ trỏ vào thư mục tương ứng trên NAS. Nhưng khả năng phải khai thác lại những dữ liệu này là khá thấp. Chỉ có một số trường hợp là ảnh nằm trong dự án tư liệu cá nhân hoặc khách hàng làm mất ảnh mà ảnh đó đã bị xoá khỏi Google Drive hoặc chưa có trên kho photos.timestudio.vn.

Tự đánh giá

Quy trình trên không phải là một quy trình 3-2-1 hoàn hảo vì bản sao thứ 3 không phải lúc nào cũng có và thường là bản JPEG đã chỉnh sửa.

Đành phải đợi đến khi giá dịch vụ lưu trữ đám mây rẻ hơn vài lần. Còn bây giờ, anh nghĩ 2,5-2-1 cũng là tương đối an toàn rồi.