提升效率/生產力局倡設數據流通機制
AI的應用離不開數據。在生產力局首席數碼總監黎少斌看來,若企業訓練AI時只運用所謂「普及的數據」,那麼AI會給出的就只是「普通的答案」,因此鼓勵企業收集使用「自己的數據」,如自身生產線的數據,相信以此訓練模型提供的答案會更有針對性。
「不過,現在哪怕茶餐廳都會開始有自己的外賣數據和掃碼點菜數據了。」黎少斌笑着說。他指出,疫情幫助很多企業數碼化,當下電子數據的普及情況較疫情前好很多。但需要海量數據來開發AI解決方案的企業,在港仍會面對數據不足的問題,他希望能有更清晰的數據流通機制供企業參考,協助數據的流通使用。
香港科技園公司智慧數碼服務總監霍露明亦指出,許多企業在幾十年歷史裏已積累了許多自身數據,惟其主要是低質量數據,目前本港高質數據仍較稀缺。
港大部分企業未做到「數字化」
數據為何還分高低質量?霍露明解釋說,低質數據可看成是零碎的筆記,高質量數據就是成篇的文章。高質量數據能提高模型的準確性和預測效果,但將低質量數據轉化為高質量數據需耗費大量金錢人力。在她看來,目前這一轉化成本對企業而言或非必須,期待未來有AI助力,提供更具性價比的轉化方案。
她解釋「數碼化」及「數字化」概念,指「數碼化」即自動化的過程,如將手寫數據「digitalize」,對企業而言相對簡單,現有許多AI應用方案可協助本港企業完成轉型。然而企業若能利用數據獲取新利益且推動其業務發展,才是真正實現「數字化」,惟目前本港大部分企業尚未做到。
她續指出,本港大多數企業運用AI仍停留在較基礎的自動化層面,若要進行更高端應用,如作為預測模型等,則未必已準備好。她舉例,若將AI用於面向客戶的環節,牽涉到決策等,那麼AI做的決定是否需要公司負責?公司應負多大程度的責任?相關法例尚未健全的情況下,很多公司未必敢把更重要的環節交由AI處理。