文章目錄
AI 數位轉型 | 資料架構的本質:遠不只是技術藍圖
在 AI 數位轉型的浪潮中,有一個現象:許多組織僅是將資料上雲,卻忽略了資料架構的核心定位。
根據 ISO/IEC 42010:2007 的定義,架構是「一個系統最核心的組織方式,包含其組成元件、彼此之間的關係,以及與外部環境的互動,還有支配系統設計與演進的原則」。
但在實務工作中,資料架構往往被簡化為「系統設計圖」,而忽略了它更深層的商業意涵。
資料架構的三個面向
真正的資料架構應該從三個角度來探討:
- 成果 (outcomes):各層級的模型、定義、資料流與規範文件,這些統稱為資料架構產物。
- 活動 (activities):用以建立、部署並落實資料架構目標的各種行動。
- 行為 (behavior):影響企業資料架構的各種角色之間的協作、思維模式與技能。
這三者共同構成資料架構的核心要素,缺一不可。
AI 數位轉型 | 上雲不等於轉型成功
雖然「上雲」成了許多企業的首要目標,但是,僅僅將資料搬到雲端,並不代表就能達到轉型目的。
以下是常見的幾個迷思:
1. 缺乏目標導向
上雲只是基礎設施的變更,不代表資料自然會更好用。如果沒有先釐清商業目標(例如要加速新品上市、改善顧客體驗、降低營運成本),上雲後的資料架構可能與實際決策需求脫節。
2. 資料問題不會因為上雲自動解決
- 髒資料、欄位缺失、定義不一致等問題,在雲端依然存在。
- 沒有資料架構師去建立規範、統一定義,這些問題只會「被搬到另一個地方」。
- 有時反而會因為多了雲端環境,增加存取與整合的複雜度。
3. 雲成本與風險管理不足
如果沒有架構規劃,資料存放方式、傳輸頻率、權限設計都可能不合理,導致雲端成本爆表或資料外洩風險升高。而資料架構師的角色,就是確保上雲方案同時兼顧成本控制、安全性與長期擴展性。
AI 數位轉型 | 資料架構的商業驅動元素
回到本質,資料架構最終是因為商業目標才有存在的必要:
- 策略性地為組織做好準備,使其能快速調整產品、服務與資料,以抓住新興技術所帶來的商業機會。
- 將商業需求轉換為資料與系統需求,確保業務流程能持續獲取所需的資料。
- 促進業務部門與 IT 部門的一致與協作,成為變革與轉型的推動者。
資料架構師的核心工作,要能夠進行商業溝通,協助企業發掘資料使用機會、降低成本及減輕風險,並提升資料所帶來的價值。
AI 數位轉型 | 架構的本質是藍圖與團隊
如果白話比喻,資料架構就像是「蓋房子的藍圖與團隊」:
- 它可以是你現在的資料環境長什麼樣(現況)
- 也可以是資料系統的各個元件與結構(組成元件)
- 或是設計資料系統的專業(架構師的技術)
- 甚至是未來資料系統的設計圖(提案)
真正成功的資料架構,不僅是滿足當前的技術需求,更要能支援組織長期的資料標準化與整合,成為業務決策與創新的堅實基礎。
AI 數位轉型 | 線性成長如何進行資料架構規劃
以 GenBI 生成式商業智慧為例,要面對的是會員、銷售、產品與分類 … 等 結構化資料,
雖然最終希望能夠使用自然語言查詢資料,但更重要的是,問問題的人能不能拿到正確的答案,且能將數據洞見用在實際的商業目標上。
1. 識別企業的資料需求
假設一間零售公司想用 GenBI 讓營運、行銷、財務部門直接用自然語言查數據,就必須先知道他們需要什麼資料:
- 營運部門:即時庫存、訂單履約狀況
- 行銷部門:不同活動的轉換率、廣告投資報酬率(ROAS)
- 財務部門:月營收、毛利率
這些需求可能來自不同結構的資料來源(SQL 資料庫、Google Analytics、ERP、Excel 檔)。
2. 設計與維護主藍圖
主藍圖就是一份完整的資料設計圖,描述:
- 這些資料要存在哪裡(BigQuery?PostgreSQL?)
- 要怎麼命名與定義(統一「營收」是含稅還是未稅)
- 不同系統之間要如何連接(API、ETL 流程、資料表關聯)
- 權限與安全規範(誰可以查明細、誰只能看彙總)
這份藍圖會一直維護與更新,因為企業的數據需求和系統會變化。
3. 用主藍圖來指引資料整合、控管資料資產
有了藍圖後,技術團隊就能按圖施工:
- 從 ERP、GA4、廣告平台拉數據到資料倉儲
- 清理與轉換成一致格式
- 設定資料品質檢查與存取權限
這樣 GenBI 查詢時,才不會因為欄位定義不同、數據不一致而給錯答案。
4. 讓資料投資與商業策略保持一致
假設企業策略是「提升會員消費頻率」,那藍圖會確保:
- GenBI 能即時查詢會員分群、回購週期
- 資料模型包含行銷活動與會員行為的關聯
- 避免花錢收集不會支持策略的資料
AI 數位轉型 | 結語
雖然看起來是一個新的資料使用方法,但背後必須對齊企業的商業戰略,具體的協助當前的營收成長、營運成本下降或階段性目標。 並且為未來的每一步預先做準備。
上雲只是開始,不是終點,而商業目標與資料架構能夠緊密結合,是線性成長數位最在意的事。