Tài liệu này CHỈ tính chi phí hạ tầng AI (GPU compute, storage, database, CDN cho việc gen ảnh). KHÔNG bao gồm:
Các chi phí vận hành khác do đội Insights.is / Foxetales tự tính dựa trên mô hình kinh doanh thực tế.
| Tham số | Giá trị | Ghi chú |
|---|---|---|
| Conversion rate visitor → order | 2% | Realistic cho e-commerce personalized gift (industry benchmark 1-3%) |
| Preview sessions / 1 order thành công | ~50 | 50 visitor xem preview để có 1 đơn (do conversion 2%); mỗi visitor có thể preview lại 2-3 lần |
| Ảnh / preview session | 4 | Khách thấy 4 trang sample |
| Ảnh / full book | 35 | Sách trung bình 30-40 trang |
| Regen từ admin / order | ~8 ảnh | Realistic review cycle, team có thể reject 2-3 trang × 2-3 lần regen |
| Failed / retry overhead | +15% | Cold start, job fail, retry tự động |
| Hạng mục | Đơn giá | Nguồn |
|---|---|---|
| GPU A100 80GB SXM (RunPod Serverless) | $1,89 / giờ | RunPod pricing |
| Thời gian gen 1 ảnh (Flux + PuLID + LoRA + ControlNet) | ~10-12 giây | POC đã verify trên A100 |
| Cost / ảnh (raw GPU) | ~$0,0063 | 11s × $0,000525/s |
| Storage Cloudflare R2 | $0,015 / GB-tháng | Cloudflare pricing |
| Bandwidth / CDN egress | $0 (free) | R2 zero egress |
| Kích thước 1 ảnh PNG 1024×1024 | ~1,5 MB | Output Flux trung bình |
| Retention storage | 90 ngày | Sau đó archive hoặc xóa |
Mỗi 1 order thành công đòi hỏi GPU consumption như sau:
| Activity | Ảnh | GPU seconds | Cost GPU (USD) |
|---|---|---|---|
| Preview sessions (50 × 4 ảnh) | 200 | 2.200 | $1,155 |
| Full book gen (35 ảnh) | 35 | 385 | $0,202 |
| Regen từ admin (~8 ảnh) | 8 | 88 | $0,046 |
| Subtotal trước overhead | 243 | 2.673 | $1,403 |
| +15% retry / fail / cold start overhead | 36 | 401 | $0,210 |
| Tổng / đơn | ~279 | ~3.074s (~51 phút) | ~$1,613 |
Cost GPU thực tế mỗi đơn: ~$1,61 (raw, chưa tính buffer cho idle/billing overhead).
Bảng dưới đây tính chi phí hạ tầng AI dự trù theo các scenario từ 1.000 đơn/tháng đến 10.000 đơn/tháng.
| Scale (đơn/tháng) | 1.000 | 2.500 | 5.000 | 7.500 | 10.000 |
|---|---|---|---|---|---|
| Tổng ảnh gen / tháng | 279.000 | 697.500 | 1,4M | 2,1M | 2,8M |
| Tổng GPU hours / tháng | 854 | 2.134 | 4.268 | 6.402 | 8.536 |
| Cost GPU (raw) | $1.614 | $4.034 | $8.067 | $12.101 | $16.134 |
| +25% buffer (cold start, idle, retry) | $404 | $1.008 | $2.017 | $3.025 | $4.034 |
| Cost GPU effective | $2.018 | $5.042 | $10.084 | $15.126 | $20.168 |
| Storage R2 (rolling 90 ngày) | $19 | $47 | $94 | $141 | $188 |
| Database + KV + Workers (Cloudflare) | $20 | $50 | $100 | $150 | $200 |
| Claude.ai account (cho vendor) | $30 | $30 | $30 | $30 | $30 |
| Domain + monitoring (Sentry, etc.) | $30 | $50 | $50 | $80 | $100 |
| Tổng infra AI / tháng (USD) | ~$2.117 | ~$5.219 | ~$10.358 | ~$15.527 | ~$20.686 |
| Tổng infra AI / tháng (VND) | ~55,8M | ~137,5M | ~273,0M | ~409,2M | ~545,2M |
| Cost infra AI / đơn (USD) | $2,12 | $2,09 | $2,07 | $2,07 | $2,07 |
| Cost infra AI / đơn (VND) | ~55.800đ | ~55.000đ | ~54.600đ | ~54.500đ | ~54.500đ |
Tổng infra/tháng theo VND tính tròn theo tỷ giá 1 USD = 26.355 VND. Số thực tế biến động theo tỷ giá liên ngân hàng tại thời điểm thanh toán.
Trong 1 đơn $2,02 cost AI, phân bổ như sau:
| Activity | Cost (USD) | Tỷ trọng |
|---|---|---|
| Preview sessions (visitor browsing) | $1,44 | 71,3% |
| Buffer cold start, retry, idle | $0,40 | 19,8% |
| Full book gen sau order | $0,25 | 12,4% |
| Regen admin | $0,06 | 3,0% |
| Storage, DB, network | ~$0,02 | 1,0% |
| Tổng | $2,02 | 100% |
Mô hình hiện tại của Foxetales phải sản xuất hàng nghìn variant artwork cho mỗi quyển sách để cover các tổ hợp cá nhân hoá (skin tone, hair, glasses, outfit…). Cách này tốn nhiều design resource thủ công, khó scale, và bị giới hạn mức độ personalization.
So với mô hình AI đề xuất trong tài liệu này:
| Tiêu chí | Hiện tại (thủ công) | Với AI image gen |
|---|---|---|
| Số artwork cần sản xuất / sách | Hàng nghìn variant (cover mọi tổ hợp) | 1 bộ template gốc + 1 LoRA train 1 lần |
| Design resource cần thiết | Team artist / illustrator full-time | Giảm mạnh (chỉ cần cho template gốc) |
| Mức độ cá nhân hoá | Giới hạn trong các variant đã vẽ sẵn | Không giới hạn — mỗi khách một face riêng từ ảnh upload |
| Time-to-market khi thêm sách mới | Tuần / tháng (vẽ và kiểm duyệt variant) | 2-4 tiếng (train LoRA mới từ artwork có sẵn) |
| Biến phí (variable cost) mỗi đơn | Thấp, nhưng bị đội bởi fixed cost đội design | ~$2,07 infra / đơn (đã tính trong tài liệu này) |
| Khả năng scale (1k → 10k đơn/tháng) | Cần hire thêm designer tương ứng | Tự động auto-scale hạ tầng, design team không cần mở rộng |
Sau khi launch ổn định, các optimization sau có thể triển khai trong Phase 2 retainer của Weaverse:
| Optimization | Tiềm năng tiết kiệm | Thời gian dev | Ưu tiên |
|---|---|---|---|
| Cache preview ảnh per-user (1 visitor preview lại không tính tiền) | -30% preview cost | 3-5 giờ | Rất cao |
| Giảm preview từ 4 ảnh xuống 2 ảnh (test conversion impact) | -50% preview cost | 2-3 giờ | Cao (cần A/B test) |
| Quantize Flux FP8 thay vì BF16 | -30% GPU time mọi ảnh | 4-6 giờ | Cao |
| Use cheaper GPU (A40/L40S) cho preview lane | -40% cost preview | 4-6 giờ | Cao |
| Batch processing cho full book gen | -15% GPU time book | 5-8 giờ | Trung bình |
| Dedicated RunPod instance khi >5k orders/tháng | -25% so với serverless | 3-4 giờ | Cao khi scale |
| Skip ControlNet cho preview (chỉ dùng cho full book) | -15% GPU time preview | 2-3 giờ | Trung bình |
Kết hợp tất cả optimization (estimate): cost effective có thể giảm xuống ~$0,90-1,10 / đơn (so với $2,07 hiện tại). Ở scale 5.000 đơn/tháng, tiết kiệm ~$5.000/tháng (~131,8M VND).
Giả định Foxetales scale từ 500 đơn/tháng (tháng 3 sau khi launch) tới 5.000 đơn/tháng (tháng 12):
| Tháng | Đơn / tháng | Infra USD | Infra VND |
|---|---|---|---|
| Tháng 1-2 (Phase 1 build, chưa launch) | 0 | ~$100-200 | ~2,6-5,3M |
| Tháng 3 (soft launch) | 500 | ~$1.100 | ~29,0M |
| Tháng 4-5 | 1.000-1.500 | ~$2.100-3.200 | ~55,3-84,3M |
| Tháng 6-7 | 2.000-2.500 | ~$4.200-5.200 | ~110,7-137,1M |
| Tháng 8-9 | 3.000-3.500 | ~$6.200-7.300 | ~163,4-192,4M |
| Tháng 10-11 | 4.000-4.500 | ~$8.300-9.300 | ~218,7-245,1M |
| Tháng 12 | 5.000 | ~$10.358 | ~273,0M |
| Tổng năm 1 (chưa optimize) | ~30.000 đơn | ~$60.000-65.000 | ~1,58-1,71 tỷ VND |
| Tổng năm 1 (có optimize, tháng 6+) | ~30.000 đơn | ~$45.000-50.000 | ~1,19-1,32 tỷ VND |
| Rủi ro | Mức ảnh hưởng cost | Mitigation |
|---|---|---|
| Traffic spike (Black Friday, viral) | 2-3x cost trong tuần spike | Cap max workers 8 trên RunPod; alert ở 80% budget |
| Khách spam preview (bot, abuse) | 20-50% extra cost | Rate limit per IP + CAPTCHA + safety filter chặn ảnh ko hợp lệ |
| Conversion rate < 2% (vd 1%) | 1,5-2x cost preview (chiếm 71%) | Conversion optimization; cache preview triệt để |
| RunPod tăng giá GPU | 10-20% / năm có thể xảy ra | Multi-provider fallback (Modal, Beam) sẵn sàng migrate |
| Retry rate cao do model fail | 10-25% extra cost | Tune workflow + retry logic; monitor failure rate |
| Storage tăng do giữ ảnh quá lâu | $50-200/tháng nếu retention > 90 ngày | Auto-delete sau 90 ngày, hoặc archive sang cold storage |
Khuyến nghị budget buffer: dự trù thêm 25-35% so với base cost trong 3 tháng đầu để cover unexpected. Sau đó giảm về 15-20% khi đã có data thực tế.
| Câu hỏi | Trả lời nhanh |
|---|---|
| 1 đơn hàng cost AI infra bao nhiêu? | ~$2,07 (~54.500 VND) realistic, conservative |
| 1.000 đơn/tháng tốn infra AI bao nhiêu? | ~$2.117/tháng (~55,8M VND) |
| 5.000 đơn/tháng tốn infra AI bao nhiêu? | ~$10.358/tháng (~273M VND) |
| 10.000 đơn/tháng tốn infra AI bao nhiêu? | ~$20.686/tháng (~545M VND) |
| Phần lớn cost đến từ đâu? | Preview (71%) — khách browse trước khi mua |
| Cost / đơn có giảm khi scale lên ko? | Không đáng kể vì GPU pay-per-second. Optimization có thể giảm 40-60% |
| Optimization tiềm năng? | Cache preview, FP8 quantize, cheaper GPU preview lane, batch processing → cost xuống ~$0,90-1,10/đơn |
| Khi nào triển khai optimization? | Tháng 4-6 sau launch, khi có data thực tế |
| Lợi thế lớn nhất so với mô hình thủ công? | Chuyển fixed cost design (team artist vẽ hàng nghìn variant) sang variable cost infra (GPU pay-per-use). Scale ko cần hire thêm designer |
| Time-to-market cho sách mới? | Train LoRA chỉ 2-4 tiếng thay vì hàng tuần / tháng vẽ và QA variant |