FIL.VN – Data Availability & Decentralized Storage ⏱ ~18 phút đọc  |  🔗 ZRO.VN
Decentralized Storage · Data Availability · Blockchain Modular

FIL – DATA AVAILABILITY
& LƯU TRỮ PHI TẬP TRUNG

Hạ Tầng Dữ Liệu Của Blockchain Thế Hệ Tiếp Theo
📌 FIL.VN – Knowledge Base 📅 Cập nhật: Tháng 3/2025 ⏱ ~18 phút đọc 🎓 Technical Deep-Dive 📚 13 bài viết
📋 Tóm tắt nội dung

Data Availability (DA) và Decentralized Storage là hai lớp hạ tầng phân biệt nhưng bổ sung cho nhau trong blockchain modular. DA đảm bảo dữ liệu block có thể được tải xuống và xác minh trong một cửa sổ thời gian ngắn; Storage đảm bảo dữ liệu tồn tại lâu dài và có thể truy cập bất kỳ lúc nào. Filecoin (FIL) giải quyết bài toán lưu trữ phi tập trung có thể xác minh thông qua Proof of Replication và Proof of Spacetime – cung cấp lớp incentive kinh tế cho IPFS. Tài liệu này phân tích cả hai bài toán ở cấp độ kỹ thuật, không phụ thuộc quan điểm đầu tư.

ITại sao lưu trữ dữ liệu là bài toán hạ tầng

Một hiểu nhầm phổ biến: vì blockchain lưu dữ liệu vĩnh cửu, nên đây là giải pháp lưu trữ tốt. Thực tế ngược lại.

Blockchain (ví dụ Ethereum) lưu dữ liệu trực tiếp on-chain với chi phí rất cao vì mỗi byte phải được mọi node trong mạng sao chép và xác minh. Một giao dịch Ethereum trung bình chứa khoảng 100–300 byte calldata; lưu 1 MB dữ liệu trực tiếp trên Ethereum mainnet có thể tốn hàng nghìn USD tùy theo gas price. Đây không phải giải pháp lưu trữ dữ liệu lớn.

Trên thực tế, hầu hết ứng dụng blockchain chỉ lưu hash (fingerprint) của dữ liệu on-chain, còn nội dung thực được lưu ở đâu đó bên ngoài. Đây chính là vấn đề: nếu nơi lưu trữ nội dung thực bị mất hoặc bị kiểm duyệt, hash trên blockchain trở nên vô nghĩa.

Ví dụ cụ thể: NFT metadata

Phần lớn NFT không lưu hình ảnh on-chain. Smart contract chỉ chứa một URL dạng https://api.project.xyz/token/1234 trỏ đến metadata JSON. Nếu server của project đóng cửa, NFT vẫn tồn tại trên blockchain nhưng không còn hình ảnh hay thuộc tính – về mặt kinh tế gần như mất giá trị hoàn toàn.

Điểm mấu chốt: Lưu trữ phi tập trung không phải giải pháp để thay thế blockchain. Đây là giải pháp cho lớp dữ liệu mà blockchain không được thiết kế để xử lý – dữ liệu lớn, cần lưu lâu dài, không cần đồng thuận từng byte.

Sự tách biệt giữa lớp đồng thuận (blockchain) và lớp dữ liệu (storage) là xu hướng thiết kế chủ đạo trong blockchain modular hiện nay. Xem thêm: NFT Storage – Giải pháp lưu trữ NFT phi tập trung.

IIData Availability và Storage – Hai bài toán khác nhau

Hai khái niệm này thường bị dùng lẫn lộn nhưng giải quyết vấn đề hoàn toàn khác nhau.

Tiêu chíData Availability (DA)Decentralized Storage
Mục tiêuĐảm bảo dữ liệu block có thể download và xác minh ngayLưu trữ dữ liệu dài hạn, có thể truy cập bất kỳ lúc nào
Cửa sổ thời gianNgắn (vài giờ – vài ngày)Dài hạn (năm đến thập kỷ)
Đối tượng chínhCác block trong L1/L2 cần xác minhDữ liệu người dùng, file, media, dataset
Metric quan trọngThroughput, latency, sampling efficiencyDurability, retrieval speed, cost per GB
Ví dụ giải phápCelestia, EigenDA, Avail, Ethereum blobsFilecoin, Arweave, Storj
Cơ chế xác minhDAS, fraud/validity proofsPoRep, PoSt, Proof of Access

Hiểu sự khác biệt này quan trọng khi đánh giá một dự án: một layer tự xưng là "DA layer" nhưng thực tế chỉ cung cấp lưu trữ mà không có cơ chế sampling và verification sẽ thiếu tính năng bảo mật cốt lõi mà DA yêu cầu.

Lưu ý: Filecoin tập trung vào Decentralized Storage dài hạn có thể xác minh, không phải DA layer trong nghĩa hẹp. Với FVM (Filecoin Virtual Machine), mạng đang mở rộng sang các use case DA và compute. Xem chi tiết: DA Problem là gì?

IIIDA Problem – Lỗ hổng cốt lõi trong xác minh block

Đây là một trong những vấn đề kỹ thuật thú vị nhất trong thiết kế blockchain, và nó liên quan trực tiếp đến lý do DA layer tồn tại.

Vấn đề gốc rễ

Trong một mạng blockchain, block producer (miner/validator) có thể tạo một block hợp lệ về mặt header (đúng format, đúng chữ ký) nhưng cố tình không công bố toàn bộ dữ liệu giao dịch. Một light node chỉ download header sẽ không thể phân biệt:

  • Block hợp lệ với đủ dữ liệu giao dịch
  • Block có header hợp lệ nhưng dữ liệu giao dịch bị ẩn

Đây gọi là Data Withholding Attack. Hậu quả: block producer có thể insert giao dịch độc hại mà không ai có thể tạo fraud proof vì thiếu dữ liệu, hoặc có thể kiểm duyệt giao dịch của một số địa chỉ cụ thể.

Vì sao không đơn giản yêu cầu mọi node download toàn bộ block?

Với full node, vấn đề không tồn tại – full node download toàn bộ dữ liệu. Nhưng full node yêu cầu băng thông và lưu trữ lớn, không phù hợp với mobile client hoặc thiết bị embedded. Blockchain cần light node để có thể mở rộng đến hàng triệu người dùng; và light node cần một cách xác minh DA mà không cần download toàn bộ dữ liệu.

Bối cảnh lịch sử: Vấn đề DA được Mustafa Al-Bassam phát biểu chính thức trong bài báo "Fraud and Data Availability Proofs" (2018, cùng Vitalik Buterin và Sandeep Nailwal). Đây là nền tảng lý thuyết cho Celestia và Ethereum's danksharding roadmap. Xem thêm: Phân tích đầy đủ DA Problem →

IVData Availability Sampling – Xác minh bằng xác suất

DAS là giải pháp cho DA Problem, cho phép light node xác minh với xác suất cao mà không cần download toàn bộ block. Nguyên lý dựa trên hai kỹ thuật kết hợp:

1. Erasure Coding

Dữ liệu block được mã hóa bằng erasure code (ví dụ Reed-Solomon): từ dữ liệu gốc kích thước n, tạo ra 2n chunks. Tính chất quan trọng: chỉ cần có bất kỳ n trong số 2n chunks là có thể phục hồi toàn bộ dữ liệu gốc.

2. Random Sampling

Light node lấy mẫu ngẫu nhiên k chunks từ tổng số 2n. Nếu tất cả k samples đều available, xác suất để block producer giữ lại hơn 50% dữ liệu mà không bị phát hiện là:

# Xác suất không phát hiện fraud sau k samples:
P(undetected) = (1/2)^k

# Với k = 30 samples:
P(undetected) ≈ 1 / 1,073,741,824 ≈ 0.000000093%

# Kết luận: 30 samples là đủ để đảm bảo 99.9999999% DA
k = 30 # bandwidth: 30 × chunk_size (vài KB mỗi chunk)

3. KZG Polynomial Commitments

Để đảm bảo mỗi chunk là đúng (không bị giả mạo), DAS hiện đại sử dụng KZG commitment: block producer tạo một polynomial commitment cho toàn bộ dữ liệu, và mỗi chunk đi kèm một proof nhỏ (~48 bytes trong KZG) cho phép xác minh chunk đó thuộc đúng polynomial đã commit. Đây là công nghệ nền tảng cho EIP-4844 (blob transactions) trên Ethereum.

Ý nghĩa thực tế: Với DAS, một light node chỉ cần download ~1–2 KB để xác minh DA của một block có thể lớn đến vài MB, với xác suất an toàn gần tuyệt đối. Đây là bước nhảy vọt cho khả năng mở rộng blockchain. Xem so sánh: Celestia vs Filecoin →

VKiến trúc Filecoin – Lưu trữ có thể xác minh

Filecoin giải quyết bài toán khác: không phải DA trong cửa sổ ngắn, mà là đảm bảo dữ liệu được lưu trữ đúng và đủ trong thời gian dài mà không cần tin tưởng nhà cung cấp.

Các thành phần chính

Storage Providers (SP): Các node cung cấp dung lượng ổ đĩa. Để tham gia, SP phải lock một lượng FIL token làm collateral tương ứng với dung lượng đã cam kết. Nếu dữ liệu bị mất, collateral bị slashed.

Storage Deals: Thỏa thuận giữa client và SP, ghi lại trên blockchain với các điều khoản: kích thước, thời hạn, giá. Deal có thể public hoặc private. Xem chi tiết: Storage Deal – Cơ chế hợp đồng kỹ thuật →

Retrieval Market: Cơ chế lấy dữ liệu ra. Hiện tại đây là bottleneck yếu nhất trong hệ sinh thái (xem Mục IX).

Bảo mật kinh tế thông qua pledged collateral

Thành phầnVai tròHậu quả vi phạm
Initial PledgeCollateral khi onboard storage sectorGiảm dần nếu không đủ block reward
Deal CollateralĐảm bảo SP giữ dữ liệu theo dealSlashed nếu sector fault
Consensus StakeTham gia block productionSlashed nếu consensus violation

Cơ chế slashing tạo incentive kinh tế thực: mất dữ liệu của client dẫn đến mất tiền của SP. Đây là điểm khác biệt cốt lõi so với các giải pháp lưu trữ centralized – không cần tin tưởng nhà cung cấp, chỉ cần tin vào cơ chế kinh tế được ghi trên blockchain.

VIFIL trong kiến trúc modular blockchain

Kiến trúc blockchain modular tách biệt bốn chức năng: Execution, Settlement, Consensus, và Data Availability/Storage. Filecoin định vị tại lớp thứ tư.

So sánh các DA & Storage layer

LayerLoạiThroughputDecentralizationDurabilityChi phí
Ethereum Blobs (EIP-4844)DA~0.75 MB/blockCao (≈10K nodes)~18 ngàyThấp–trung bình
CelestiaDA~2 MB/blockCao~3 tuầnThấp
EigenDADA~10 MB/sTrung bìnhNgắn hạnRất thấp
AvailDA~2 MB/blockCaoNgắn–trung hạnThấp
FilecoinStoragePB/ngàyCao (~3,500 SP)Dài hạn (năm+)Rất thấp/GB
ArweaveStorageHạn chếTrung bìnhVĩnh viễnTrả một lần

Tích hợp với L2 Rollup

L2 rollup cần lưu calldata và state diff theo hai giai đoạn: DA ngắn hạn (để validator có thể tạo fraud proof trong challenge window) và lưu trữ dài hạn (để user có thể exit và audit sau này). Cách kết hợp tối ưu: dùng Celestia hoặc Ethereum blob cho DA ngắn hạn, Filecoin cho lưu trữ dài hạn với chi phí thấp hơn đáng kể. Xem chi tiết: L2 Blob Archiving trên Filecoin →

Dự án thực tế: Lighthouse (built on Filecoin) cung cấp storage bridge giữa Ethereum blobs và Filecoin, tự động archive dữ liệu EIP-4844 blobs sau khi chúng expire khỏi Ethereum consensus.

VIIIPFS – Giao thức địa chỉ hóa theo nội dung

IPFS (InterPlanetary File System) là giao thức P2P để chia sẻ và tìm kiếm file, nhưng thường bị hiểu sai là một giải pháp lưu trữ. Sự khác biệt quan trọng:

Location-based vs Content-based Addressing

URL truyền thống là location-based: https://example.com/image.jpg chỉ một địa điểm cụ thể trên internet. Nếu server đó mất, URL không còn hoạt động, kể cả nếu file đó tồn tại ở nơi khác.

IPFS CID (Content Identifier) là content-based: bafybeigdyrzt5sfp7udm7hu... là hash của nội dung file. Bất kỳ node nào có file đó đều có thể phục vụ request, vì CID luôn trỏ đúng đến nội dung đó bất kể file ở đâu.

# CID v1 – Content Identifier có cấu trúc:
CID = multibase(multicodec(multihash(content)))

# Ví dụ thực:
bafybeigdyrzt5sfp7udm7hu76uh7y26nf3efuylqabf3oclgtqy55fbzdi
# → SHA2-256 hash của content, encoded base32
# → Bất kỳ node nào giữ content này đều có thể serve

IPFS không phải lưu trữ – Filecoin cung cấp incentive layer

IPFS định nghĩa cách định địa chỉ và truyền tải dữ liệu, nhưng không đảm bảo ai sẽ giữ dữ liệu đó. Nếu không có node nào pin một file, file đó sẽ biến mất khỏi mạng IPFS khi không có ai request. Filecoin cung cấp lớp incentive kinh tế: trả FIL để Storage Provider cam kết giữ dữ liệu trong thời gian xác định, có thể xác minh cryptographic.

Tóm lại: IPFS + Filecoin = addressing protocol + economic storage guarantee. Dùng IPFS không có Filecoin chỉ là "nếu ai đó muốn giữ thì sẽ còn". Dùng Filecoin là "có hợp đồng kinh tế đảm bảo file còn tồn tại đến thời điểm X". Xem thêm: IPFS là gì? So sánh IPFS và Filecoin →

VIIIProof of Spacetime – Đồng thuận dựa trên không gian lưu trữ

Đây là cơ chế đặc trưng của Filecoin, giải quyết bài toán xác minh mà không cần kiểm tra thủ công: làm thế nào biết SP thực sự đang lưu đúng dữ liệu, không phải chỉ nói vậy?

Proof of Replication (PoRep)

Trước khi lưu trữ, SP phải prove rằng họ đã tạo một bản sao vật lý độc đáo của dữ liệu trên phần cứng của họ. "Độc đáo" ở đây có nghĩa là proof bị ràng buộc với node cụ thể – SP không thể chia sẻ một bản sao vật lý cho nhiều deal hoặc generate proof từ xa. Quá trình Sealing (tạo PoRep) mất 1–2 giờ/sector (32 GB hoặc 64 GB) và tốn kém về compute.

Proof of Spacetime (PoSt)

Sau khi seal xong, SP phải định kỳ (mỗi 24 giờ) submit proof rằng dữ liệu vẫn còn đó. Có hai loại:

  • WindowPoSt: Mỗi 24 giờ, SP phải submit proof cho tất cả sectors. Nếu thiếu, sector bị đánh dấu "faulty" và collateral bắt đầu bị slashed.
  • WinningPoSt: Được chọn ngẫu nhiên để tạo block. SP được chọn dựa trên lượng storage đang active (Quality-Adjusted Power), không phải hash power. Reward nhận được tỷ lệ thuận với storage đang được chứng minh.
Cơ chế đồng thuậnResource sử dụngXác minhChi phí tấn công
Proof of Work (Bitcoin)Compute (hash)Tức thìMua/thuê hardware hash
Proof of Stake (Ethereum)Token stakeTức thìMua >33% token
Proof of Spacetime (Filecoin)Disk space + sealing computeĐịnh kỳ 24hKiểm soát lượng lớn HDD + sealing compute

Một điểm đáng lưu ý: chi phí sealing (PoRep) cao về compute khiến một số SP lớn có lợi thế hơn so với SP nhỏ, tạo áp lực tập trung hóa nhất định vào các trung tâm dữ liệu chuyên nghiệp. Xem chi tiết: Proof of Spacetime – Phân tích kỹ thuật đầy đủ →

IXRetrieval – Bottleneck thực tế của lưu trữ phi tập trung

Lưu trữ rẻ không có ý nghĩa nếu truy xuất chậm hoặc không đáng tin cậy. Đây là điểm yếu được thừa nhận rộng rãi nhất của hệ sinh thái Filecoin cho đến nay.

Vấn đề với Retrieval Market ban đầu

Trong thiết kế gốc, lấy dữ liệu từ Filecoin yêu cầu một retrieval deal: client trả micropayment FIL theo từng chunk dữ liệu nhận được (payment channel). Về lý thuyết hợp lý, nhưng thực tế không có SP nào tối ưu hóa retrieval vì block reward từ storage đã đủ hấp dẫn và không có slashing cho retrieval chậm. Kết quả: retrieval latency thường trong khoảng phút đến giờ, hoàn toàn không phù hợp cho ứng dụng web thông thường.

Saturn Network và CDN phi tập trung

Saturn là CDN layer xây trên Filecoin, cho phép các node caching earn FIL token bằng cách serve dữ liệu nhanh cho end user. Đây là một bước theo đúng hướng: tách biệt storage (Filecoin) và CDN delivery (Saturn), tương tự cách web2 tách biệt object storage (S3) và CDN (CloudFront). Xem thêm: Saturn CDN – Hạ tầng delivery phi tập trung →

Filecoin Virtual Machine (FVM)

Được ra mắt năm 2023, FVM cho phép chạy smart contract trên Filecoin, mở ra khả năng:

  • Lập trình điều kiện cho storage deal (ví dụ: deal tự gia hạn nếu còn balance)
  • Perpetual storage với endowment model (tương tự Arweave)
  • Decentralized compute over stored data (Bacalhau)
  • Cross-chain storage attestation cho L2

Xem chi tiết: Filecoin Virtual Machine (FVM) – Smart contract trên Filecoin →

Tình trạng hiện tại: Retrieval vẫn là điểm yếu so với các CDN tập trung, nhưng khoảng cách đang thu hẹp. Với Saturn và các retrieval layer đang phát triển, dữ liệu hot cache có thể đạt latency <100ms tại các region lớn.

XỨng dụng thực tế của lưu trữ phi tập trung

Khi nào thực sự cần dùng Filecoin hoặc giải pháp tương tự, thay vì AWS S3?

Use caseLý do dùng decentralized storageGiải pháp phù hợp
NFT & Digital AssetsTránh link rot, metadata cần tồn tại lâu dài không phụ thuộc projectIPFS + Filecoin, NFT.Storage
L2 Blob ArchivingEIP-4844 blob expire sau ~18 ngày, cần archive dài hạn cho auditFilecoin/Lighthouse Bridge
AI Dataset bất biếnAI training data, scientific dataset cần immutable referenceFilecoin + CID versioning
Archive & PreservationWeb archiving, legal document không thể alterFilecoin, Arweave
Cross-chain State ProofLưu state snapshot để prove cross-chainFilecoin + FVM verification
dApp frontend hostingTránh censorship một điểm (domain/server)IPFS + ENS, Fleek
Khi nào không nên dùng: Dữ liệu thay đổi thường xuyên (user profile, session data), ứng dụng cần retrieval latency <50ms globally, hoặc dữ liệu nhạy cảm cần xóa được (GDPR right to be forgotten – content-addressed storage không support xóa).

XIFramework đánh giá DA & Storage Layer

Thay vì hỏi "dự án nào tốt nhất?", đánh giá theo năm trục sau tùy theo use case cụ thể:

Trục đánh giáCâu hỏi cốt lõiFilecoinCelestiaArweaveEigenDA
Decentralization Có bao nhiêu node độc lập? ~3,500 SP – cao Cao (light node DAS) Trung bình Phụ thuộc EigenLayer
Durability Dữ liệu tồn tại bao lâu? Theo deal (năm+) Ngắn (~18 ngày) Vĩnh viễn (endowment) Ngắn hạn
Verifiability Verify on-chain rằng dữ liệu đang được lưu? ✅ PoSt on-chain DAS proof Proof of Access KZG commitment
Throughput Bao nhiêu dữ liệu có thể handle? PB/ngày ~2 MB/block Hạn chế ~10 MB/s
Retrieval Latency Lấy dữ liệu ra mất bao lâu? Giây–phút (Saturn: <1s hot) N/A Giây N/A
Không có giải pháp tối ưu cho mọi use case. DA ngắn hạn throughput cao → EigenDA hoặc Celestia. Lưu trữ vĩnh viễn → Arweave. Lưu trữ linh hoạt dài hạn với smart contract → Filecoin. Kết hợp là kiến trúc phổ biến nhất.

XIIKết luận – Dữ liệu là hạ tầng, không phải phụ kiện

Blockchain modular tách biệt execution khỏi data, và sự tách biệt này đặt ra yêu cầu rõ ràng: cần có lớp dữ liệu độc lập, có thể xác minh, không phụ thuộc vào một công ty hay server.

Các điểm cốt lõi cần ghi nhớ:

  • DA và Storage là hai bài toán riêng biệt – đừng nhầm lẫn hoặc dùng một giải pháp cho cả hai
  • IPFS là giao thức định địa chỉ, không phải lưu trữ – cần Filecoin hoặc pinning service để đảm bảo dữ liệu tồn tại
  • Proof of Spacetime đảm bảo lưu trữ có thể xác minh on-chain mà không cần tin tưởng SP
  • Retrieval vẫn là điểm yếu của hệ sinh thái – đang được cải thiện qua Saturn và FVM
  • Kết hợp nhiều layer (DA ngắn hạn + Storage dài hạn) là kiến trúc thực tế cho L2 và ứng dụng nghiêm túc

Trong dài hạn, hạ tầng dữ liệu phi tập trung sẽ quan trọng không kém consensus layer: một ứng dụng có smart contract bất biến nhưng dữ liệu được lưu trên server tập trung vẫn có single point of failure.

Hiểu lưu trữ phi tập trung là hiểu bước cuối cùng để đạt được phân tán thực sự – khi không còn điểm nào trong hệ thống phụ thuộc vào một thực thể duy nhất.

📖12 Bài Viết Chuyên Sâu – Khám Phá Toàn Bộ Cluster

Mỗi bài viết đi sâu vào một khía cạnh cụ thể của hệ sinh thái Filecoin và Data Availability – được nghiên cứu độc lập và có thể đọc riêng lẻ.

🅐 Kiến Thức Nền Tảng

🅑 So Sánh & Cạnh Tranh

🅒 Ứng Dụng Thực Tế

🅓 Kỹ Thuật Nâng Cao

Tác giả
Đội nghiên cứu Web3 Infrastructure · zro.vn
ZRO Research là đội nghiên cứu Web3 Infrastructure thuộc ZRO.VN – chuyên phân tích Filecoin, Data Availability và blockchain modular. Nội dung được xây dựng từ tài liệu kỹ thuật gốc và whitepaper. Truy cập zro.vn để xem thêm.
Filecoin Protocol Data Availability Blockchain Modular IPFS & Web3 Storage

Câu Hỏi Thường Gặp

Data Availability (DA) là gì và tại sao quan trọng với blockchain?
Data Availability (DA) là khả năng đảm bảo dữ liệu block có thể được tải xuống và xác minh bởi bất kỳ node nào trong mạng trong một cửa sổ thời gian ngắn. DA quan trọng vì nếu block producer giữ lại dữ liệu (Data Withholding Attack), các light node không thể phân biệt block hợp lệ với block bị giả mạo. Đây là nền tảng bảo mật cho kiến trúc blockchain modular. Xem chi tiết: DA Problem là gì →
Filecoin khác gì so với AWS S3 hay Google Cloud Storage?
Filecoin là lưu trữ phi tập trung có thể xác minh cryptographic: không cần tin tưởng nhà cung cấp, dữ liệu được xác minh on-chain qua Proof of Spacetime mỗi 24 giờ, và vi phạm hợp đồng bị phạt tự động (slashing collateral). AWS S3 và Google Cloud là dịch vụ tập trung – phải tin tưởng công ty, có thể bị kiểm duyệt hoặc xóa bất kỳ lúc nào. Chi phí Filecoin thấp hơn đáng kể (~$1–5/TB/năm so với ~$23/TB/tháng của S3).
IPFS và Filecoin khác nhau như thế nào?
IPFS là giao thức định địa chỉ theo nội dung (content-addressed) – nó định nghĩa cách tìm kiếm và truyền tải file bằng CID, nhưng không đảm bảo ai sẽ giữ dữ liệu. Filecoin là lớp incentive kinh tế: bạn trả FIL để Storage Provider cam kết giữ dữ liệu trong thời gian xác định, có hợp đồng on-chain và bị phạt nếu vi phạm. IPFS = địa chỉ, Filecoin = cam kết lưu trữ. Xem thêm: IPFS là gì →
Data Availability Sampling (DAS) hoạt động như thế nào?
DAS cho phép light node xác minh Data Availability mà không cần download toàn bộ block. Cơ chế gồm 2 bước: (1) Erasure Coding – dữ liệu gốc n bytes được mã hóa thành 2n chunks, chỉ cần bất kỳ n/2 là đủ phục hồi; (2) Random Sampling – light node lấy mẫu ngẫu nhiên k=30 chunks. Xác suất block producer giấu hơn 50% dữ liệu mà không bị phát hiện chỉ là (1/2)^30 ≈ 0.000000093%. Kết hợp KZG Polynomial Commitment để xác minh tính toàn vẹn từng chunk.
Proof of Spacetime là gì và tại sao Filecoin cần nó?
Proof of Spacetime (PoSt) là cơ chế mà Storage Provider phải định kỳ (mỗi 24 giờ) chứng minh cryptographic rằng họ vẫn đang lưu đúng dữ liệu đã cam kết. Kết hợp với Proof of Replication (PoRep) – chứng minh đã tạo bản sao vật lý độc đáo – hệ thống này loại bỏ nhu cầu tin tưởng SP. Nếu SP thiếu PoSt, sector bị đánh dấu faulty và collateral bị slashed tự động. Xem phân tích đầy đủ: Proof of Spacetime →
Filecoin dùng để làm gì trong kiến trúc blockchain modular?
Trong blockchain modular, Filecoin đóng vai trò lớp Storage dài hạn: lưu trữ calldata của L2 rollup sau khi blob Ethereum (EIP-4844) expire sau ~18 ngày, lưu NFT metadata tránh link rot, archive AI training dataset bất biến, và lưu state snapshot cho cross-chain verification. Filecoin thường kết hợp với DA layer ngắn hạn như Celestia hoặc Ethereum blobs: DA ngắn hạn để validator fraud proof, Filecoin để archive dài hạn với chi phí thấp.
Khi nào nên dùng Filecoin, khi nào nên dùng Arweave?
Dùng Filecoin khi cần lưu trữ linh hoạt (có thể chọn thời hạn, gia hạn deal), dung lượng lớn (PB/ngày), hoặc cần smart contract quản lý storage qua FVM. Dùng Arweave khi cần lưu trữ vĩnh viễn thực sự (trả một lần, tồn tại mãi qua endowment model) cho dữ liệu không bao giờ thay đổi như historical record, legal document. Xem so sánh chi tiết: Filecoin vs Arweave →

📚Tài Liệu Tham Khảo

  1. Al-Bassam, M., Sonnino, A., Buterin, V. (2018). Fraud and Data Availability Proofs: Maximising Light Client Security and Scaling Blockchains with Dishonest Majorities. arXiv:1809.09044
  2. Protocol Labs (2017). Filecoin: A Decentralized Storage Network. filecoin.io/filecoin.pdf
  3. Benet, J. (2014). IPFS – Content Addressed, Versioned, P2P File System. arXiv:1407.3561
  4. Feist, D. (2022). Data Availability Sampling and Danksharding. ethereum.org
  5. Buterin, V. (2021). An Incomplete Guide to Rollups. vitalik.ca
  6. Ethereum Foundation (2023). EIP-4844: Shard Blob Transactions. eips.ethereum.org/EIPS/eip-4844
  7. Celestia Docs (2024). Data Availability FAQ. docs.celestia.org
  8. Filecoin Spec (2024). Storage Power Consensus, Proof of Spacetime. spec.filecoin.io
  9. EigenDA Docs (2024). EigenDA Overview. eigenlayer.xyz