為何有些公司有意向AI洩露數據? – 李梓敬 –

為何有些公司有意向AI洩露數據?

不少公司正在猶豫,是否應該擁抱人工智能的到來,原因在於他們擔心 AI 引擎,會將他們的專有數據,洩露給其他公司,尤其是競爭對手。但與此同時,有些公司卻有意將他們的數據,輸入到AI引擎中,將其作為品牌建設的重要一環。那麼,這究竟是一個價值數十億美元的商業機會,還是人工智能發展中的一大缺陷呢?

讓我們從頭開始瞭解。簡單來說,AI引擎有兩個組成部分。第一個是廣泛的內容數據庫,也被稱為大型語言模型(LLM),其中包含AI公司能夠找到的所有數據。例如,來自維基百科、紐約時報和其他公開可用的所有信息。

第二個組成部分是算法。算法利用LLM數據,來響應用戶提出的問題。如果我讓AI引擎來完成一句話,比如「狗在……跑」,算法會從LLM中檢索,查看這句話出現的次數,以及通常用什麼詞來完成這句話。然後,它會通過統計,給用戶提供最有可能出現的詞語。在這種情況下, 「馬路」而不是「鍋裡」,是通常情況下會出現的響應。

想要利用人工智能的公司,會從提出問題開始。例如,一家服裝公司可能會問「男士鞋最新的流行趨勢是什麼?」然而,僅僅通過提出這個問題,AI引擎就會知道,這家服裝公司正在考慮推出新款男士鞋,但這是該公司希望對競爭對手保密的信息。

在使用AI的各種方法中,有一種方法會產生尤為顯著的影響,那就是公司會上傳數據。比如上傳客戶反饋或歷史銷售數據,然後請求AI引擎找出對應的數據類型,並與LLM中的信息進行對比。然而,許多AI引擎將已經上傳的企業數據,添加到自己的LLM中,這樣當另一家公司提出同樣的問題時,就能生成一個透露這些數據的響應。儘管大多數AI公司,都出臺了政策和保護措施,來防止數據洩露的發生,但在最近的幾項研究中,60%~75%的公司已經禁止使用AI,因為他們認為這些保護措施尚不足夠。