2.注意編輯資料的方式
若您的表格或分區資料表在過去 90 天都沒有編輯過,儲存在該表格內的數據價格會自動下降約 50%。但是在效能、耐久度、可用性,或任何其他功能皆不會因為表格或分區資料表被視為長期儲存而有所衰減。
要充分運用長期儲存,所有編輯表格數據的操作都要注意,例如串流、複製、載入數據,包括所有 DML 或 DDL 操作。這會讓您的數據恢復成使用中儲存,並重設 90 天的期間。為避免這種狀況,您可以考慮將新一批次的數據載入新表格或表格分隔。
專家建議:查詢表格數據連同一些操作不會影響重設 90 天期間,您的價格依然被視為長期儲存。
在大部分狀況下,保留數據在 BigQuery 裡面是有好處的,除非您確定表格裡的數據最多一年存取一次,例如因法規或法令之故而儲存的檔案庫。在這種狀況下,可瞭解取得比 BigQuery 長期儲存更優惠的價格像是匯出表格數據到雲端儲存的 Coldline 類別。
3.避免重複複製數據
BigQuery 使用聯合數據(federated data)存取模型讓您直接從外部數據來源查詢資料,例如 Cloud Bigtable、Cloud Storage﹑Google Drive、Cloud SQL。這對於避免重複複製數據很有用,進而減少儲存成本。這對於從外部來源一次讀取數據,或是存取少量經常變更但不需要每次改變時都載入到 BigQuery 的數據很有用。
專家建議:依據最為佳的使用技術指南。通常,用外部來源執行的查詢,效能比在 BigQuery 上查詢相同數據的還差,這是因為儲存在 BigQuery 的數據是列儲存格式,產生 query 的效能更佳。
4.查看您是否使用串流插入載入數據
檢查您上個月的 BigQuery 帳單,查看是否更改為串流插入。若是如此,請問問自己:「我的 BigQuery 是否需要 即時性的數據(幾秒鐘,而非幾小時)?」或「是否只要數據一出現在 BigQuery,我就會即時使用它?」如果有答案是否定的,建議您切換為批次載入數據,因為這是完全免費的。
專家建議:只有在 BigQuery 中的數據會立即被下一個管線處理 (pipeline) 的狀況下,才使用串流插入。
5.瞭解 BigQuery 的備份與災難復原(DR)流程。
BigQuery 保留表格過去七日內的更改,讓您可以查詢數據當時的截圖。這表示您可以不用重新載入復原備份,就能還原過往數據。如果表格被刪除,兩天後會刷新其歷史紀錄。
要從一小時前的表格截圖找到行數,使用以下查詢: