為何有些公司有意向AI洩露數據？

Published by Wong suiwanjoe at 17/04/2024

Tags

不少公司正在猶豫，是否應該擁抱人工智能的到來，原因在於他們擔心 AI 引擎，會將他們的專有數據，洩露給其他公司，尤其是競爭對手。但與此同時，有些公司卻有意將他們的數據，輸入到AI引擎中，將其作為品牌建設的重要一環。那麼，這究竟是一個價值數十億美元的商業機會，還是人工智能發展中的一大缺陷呢？

讓我們從頭開始瞭解。簡單來說，AI引擎有兩個組成部分。第一個是廣泛的內容數據庫，也被稱為大型語言模型(LLM)，其中包含AI公司能夠找到的所有數據。例如，來自維基百科、紐約時報和其他公開可用的所有信息。

第二個組成部分是算法。算法利用LLM數據，來響應用戶提出的問題。如果我讓AI引擎來完成一句話，比如「狗在……跑」，算法會從LLM中檢索，查看這句話出現的次數，以及通常用什麼詞來完成這句話。然後，它會通過統計，給用戶提供最有可能出現的詞語。在這種情況下，「馬路」而不是「鍋裡」，是通常情況下會出現的響應。

想要利用人工智能的公司，會從提出問題開始。例如，一家服裝公司可能會問「男士鞋最新的流行趨勢是什麼？」然而，僅僅通過提出這個問題，AI引擎就會知道，這家服裝公司正在考慮推出新款男士鞋，但這是該公司希望對競爭對手保密的信息。

在使用AI的各種方法中，有一種方法會產生尤為顯著的影響，那就是公司會上傳數據。比如上傳客戶反饋或歷史銷售數據，然後請求AI引擎找出對應的數據類型，並與LLM中的信息進行對比。然而，許多AI引擎將已經上傳的企業數據，添加到自己的LLM中，這樣當另一家公司提出同樣的問題時，就能生成一個透露這些數據的響應。儘管大多數AI公司，都出臺了政策和保護措施，來防止數據洩露的發生，但在最近的幾項研究中，60%~75%的公司已經禁止使用AI，因為他們認為這些保護措施尚不足夠。