為何有些公司有意向AI洩露數據?4 月 17, 2024

不少公司正在猶豫,是否應該擁抱人工智能的到來,原因在於他們擔心 AI 引擎,會將他們的專有數據,洩露給其他公司,尤其是競爭對手。但與此同時,有些公司卻有意將他們的數據,輸入到AI引擎中,將其作為品牌建設的重要一環。那麼,這究竟是一個價值數十億美元的商業機會,還是人工智能發展中的一大缺陷呢?

讓我們從頭開始瞭解。簡單來說,AI引擎有兩個組成部分。第一個是廣泛的內容數據庫,也被稱為大型語言模型(LLM),其中包含AI公司能夠找到的所有數據。例如,來自維基百科、紐約時報和其他公開可用的所有信息。

第二個組成部分是算法。算法利用LLM數據,來響應用戶提出的問題。如果我讓AI引擎來完成一句話,比如「狗在……跑」,算法會從LLM中檢索,查看這句話出現的次數,以及通常用什麼詞來完成這句話。然後,它會通過統計,給用戶提供最有可能出現的詞語。在這種情況下, 「馬路」而不是「鍋裡」,是通常情況下會出現的響應。

想要利用人工智能的公司,會從提出問題開始。例如,一家服裝公司可能會問「男士鞋最新的流行趨勢是什麼?」然而,僅僅通過提出這個問題,AI引擎就會知道,這家服裝公司正在考慮推出新款男士鞋,但這是該公司希望對競爭對手保密的信息。

在使用AI的各種方法中,有一種方法會產生尤為顯著的影響,那就是公司會上傳數據。比如上傳客戶反饋或歷史銷售數據,然後請求AI引擎找出對應的數據類型,並與LLM中的信息進行對比。然而,許多AI引擎將已經上傳的企業數據,添加到自己的LLM中,這樣當另一家公司提出同樣的問題時,就能生成一個透露這些數據的響應。儘管大多數AI公司,都出臺了政策和保護措施,來防止數據洩露的發生,但在最近的幾項研究中,60%~75%的公司已經禁止使用AI,因為他們認為這些保護措施尚不足夠。

人工智能發展,將改變知識產權體系4 月 4, 2024

世界知識產權組織(WIPO)的總幹事鄧鴻森認為:隨著人工智能技術的不斷進步,知識產權領域也將迎來新的變革。

在海南召開的博鼇亞洲論壇2024年年會上,鄧鴻森告訴記者「人工智能的存在是為了促進和支持人類創新,而不是取代或摧毀人類。」

近年來,在音樂、藝術、攝影和寫作等領域,人工智能侵犯版權的訴訟案件大幅增加。

鄧鴻森表示,知識產權體系,並不是第一次面對重大技術變革的衝擊。在上世紀90年代,隨著互聯網的興起和電子商務的出現,也曾出現過類似的情況。

「我認為人工智能不會從根本上改變知識產權體系」鄧鴻森說道。為了應對人工智能帶來的挑戰,WIPO與來自193個成員國的代表,定期舉行對話。此外,WIPO還頒佈了兩項政策法規,幫助各國和企業應對這一挑戰。

「我們期待與不同的合作夥伴合作,包括來自中國的合作夥伴,從而向中國的人工智能企業家提供支持,並利用中國的實踐,來幫助其他國家」他說。

1973年,中國政府派出了首批代表團,參加WIPO會議,並於1980年加入WIPO。去年是中國和世界知識產權組織合作的50周年。

成熟的生態系統

鄧鴻森表示,加入WIPO表明中國將創新和技術視為改革開放的重要內容。「在過去的50年裡,中國在知識產權領域,表現出了巨大的成長和進步。」

鄧鴻森表示,中國現在是世界上最大的知識產權申請國,申請內容涉及專利和商標,設計和地理標誌等各個領域。

2023年,中國提交了69610份專利合作條約(PCT)申請,是申請PCT最多的國家。鄧鴻森表示,其中大部分申請來自數字技術領域。去年,中國的電信巨頭華為技術公司,仍然是主要申請者,共有6494份公佈的PCT申請。

「我認為,中國在過去50年裡所取得的成就,包括從一個非常初級的階段,發展到現在擁有非常成熟的生態系統,並不是巧合或偶然」,而是因為中國一直高度重視知識產權」他補充說,WIPO很高興看到中國在這一領域所取得的發展。

在近期深圳和廣州的訪問中,鄧鴻森表示,中國企業越來越重視創新,並投入了大量資源進行研發。與此同時,地方政府還建立了「適宜的生態系統」,以鼓勵創新和創意。

鄧鴻森表示,隨著中國政府追求高質量發展,創新、技術和知識產權在下一階段的發展中,將變得更加重要。此外,中國還希望利用知識產權,來應對全球性挑戰,例如氣候變化,這有助於實現聯合國設定的可持續發展目標。

歐盟按《數字市場法案》,對蘋果、Meta和穀歌進行調查3 月 27, 2024

《數字市場法案》(D.M.A.),旨在限制網絡空間中,大型平臺作為「守門人」(指那些具有顯著市場地位和影響力的超大型數字平臺)的權力。法案實施後,歐盟委員會迅速採取行動,展開調查。

此次調查涉及谷歌應用商店的轉向規則、穀歌搜索的自營偏好問題,蘋果應用商店的轉向規則、 Safari 瀏覽器選擇屏幕,以及 Meta 的「付費或同意」模式等問題。

關於應用商店,人們普遍認為應用商店,會為其所有者帶來優勢和便利。因此,應用商店的運營策略,一直受到監管部門的關注。但其是否阻礙公平競爭,仍待證實。

除此之外,在Meta方面,用戶可通過購買無廣告服務,避免數據跟蹤和廣告推送。但隱私倡導者批評到,此舉強迫用戶為隱私付費。上周,Meta宣佈將套餐降價,以吸引更多用戶。

同時,歐盟委員會還宣佈,將對蘋果公司針對替代應用商店的新收費結構,以及亞馬遜在市場上的排名做法,進行初步審查。

歐盟的《數字市場法案》,旨在確保「守門人」平臺,能夠允許第三方在其平臺內進行交互,從而促進更廣泛的市場競爭。同時,還確保用戶和企業,能夠訪問平臺所提供的數據,並確保這些數據提供者的透明度和責任制。

此外,歐盟還發佈了在數字監管領域的另一法案——《數字服務法案》(D.S.A.),X和TikTok等也將受到審查。

輕量級大語言模型相繼湧現,AI競爭升溫?3 月 13, 2024

上個月,美國科技公司OpenAI,推出了文本到視頻的生成模型Sora。此後,越來越多的中國公司,也開始著手開發輕量級大語言模型,為全球人工智能競爭格局,帶來了新變化。

輕量級模型,也被稱為較小的大型模型,指的是對參數需求更小的模型。這意味著它們相較於大型模型而言,處理和生成文本的能力會受到限制。

簡單來說,這些小的模型就像緊湊型汽車,而大模型則像運動型、多用途的豪華汽車。

今年二月,中國人工智能初創公司面壁智能(ModelBest Inc),推出了其最新的輕量級大語言模型,引起了人工智能行業的廣泛關注。

該模型名為MiniCPM-2B,參數規模為 20 億,遠小於OpenAI的GPT-4.0可以處理的1.7萬億參數。

去年十二月,美國科技巨頭微軟發佈了Phi-2,雖然參數規模僅為27億,但這款小型語言模型,能夠進行常識推理和語言理解。

面壁智能的CEO李大海表示「新模型在開源通用基準方面的性能,接近於法國人工智能公司Mistral的Mistral-7B,在中文、數學和編碼方面具有更強的能力。該模型的整體性能,超過了一些參數達到100億級別的同類大型模型。」

李大海還表示「不論是大型還是較小的大語言模型,都有各自的優勢,這取決於任務的具體要求,和它們的性能限制,但在人工智能蓬勃發展的環境中,中國公司可能會在小模型中找到一條出路。」

360集團創始人兼董事長周鴻禕,此前在接受採訪時也表示,要在當下打造出一個超越GPT-4.0的通用大模型,可能具有挑戰性。不過,雖然GPT-4.0目前「無所不知,但它並沒有深耕。」

他說「如果我們可以訓練出,具有特定行業數據的模型,並將其與行業內的其他工具整合起來,從而在該行業中取得卓越成績。這樣的模型不僅具備智能化,還將具備獨特的業務知識,從而變得無所不能。」

李大海表示,如果這樣的輕量級模型能夠應用於產業中,其商業價值將會巨大。他說「如果模型的參數規模被壓縮,運行時的計算過程就會減少,同時,這也意味著對處理器的性能要求會降低,並且響應時間也會縮短。隨著這類終端模型的普及,未來更多電子設備,如手機等,推理成本將會進一步降低。」

Instagram更新私信功能3 月 7, 2024

Instagram發佈了一些新的私信功能,旨在提高私信在APP裡面,所起到的關鍵連接作用。

根據Meta的觀察,用戶越來越不願意在Main Feed中發佈新內容,而是比較喜歡在私密聊天中,進行越來越多的互動。

所以為對應這些用戶行為,Instagram增加了消息編輯功能,你可以在消息發送後的15分鐘內編輯消息。這與WhatsApp去年新增的功能完全一樣。考慮到Meta的最終計劃,是將其所有消息工具合併為一個平臺,所以讓各個應用程序實現功能平衡,具有重要意義。

Instagram用戶,現在還可以在私信聊天框中,最多置頂三個聊天,從而能夠輕鬆地找到,他們認為最重要的聊天內容。

Instagram還增加了一項新功能,那就是可以啟用私信聊天的已讀回執功能,同時還添加了新的聊天主題,來個性化定制用戶的使用體驗。

最後,Instagram還在應用程序中,添加了有關貼紙的新選項,用戶可以保存自己喜歡的貼紙,保存的貼紙將置頂在貼紙框的頂部,從而更方便用戶在私信中使用。

這些功能變化與用戶的使用行為變化保持一致。不僅是Instagram,其他社交平臺也一樣,現在越來越多的用戶,更傾向於在私密的消息群組中分享內容,而不是發佈到Main Feed中。

2022年,面對用戶的擔憂——他們可能再也看不到自己關注的用戶,發佈新的內容。Instagram首席執行官Adam Mosseri給出了明確的回應「朋友將更多地通過Stories和私信分享動態,而不是通過Feed。」

Meta在近期平臺表現回顧中指出,現在人們在Instagram上看到的內容中,40%是通過AI推送的,這使得應用程序的使用時間,在過去一年中增加了6%。

儘管Main Feed中的帖子數量可能減少,但私信分享的內容卻大幅增加。Mosseri強調「現在人們分享內容和表達創造力的主要方式,是通過Instagram上的私信。在任何一天中,通過私信分享的圖片和視頻,都比在Stories和Feed中分享的多。」

因此,Stories現在僅次於私信,成為用戶之間互動的主要渠道,而Main Feed則更像TikTok那樣,側重於推送娛樂性質的內容。

這的確是值得關注的重要趨勢。在TikTok的引領下,Instagram正逐漸轉向由算法推動的互動,減少了對關注其他用戶的依賴,更加依賴系統向用戶推送可能感興趣的內容。

華為雲順應AI需求增長,積極在歐洲與中東擴展業務2 月 28, 2024

隨著生成式AI需求的爆發式增長,中國通信巨頭華為旗下的華為雲,亦正在開設新的數據中心,致力擴大全球影響力,希望吸引更多海外行業客戶。

在世界移動通信大會(Mobile World Congress 2024,簡稱MWC 2024)前夕,華為雲成功在巴塞羅納舉辦了一次雲峰會。華為高管在峰會上透露,公司計劃下月在埃及推出新的本地雲服務。目前,華為已在全球30個地區,設立了85個可用區。此外,高管還表示,華為還計劃在香港推出首個人工智能雲計算中心。

華為雲全球Marketing與銷售服務總裁石冀琳表示「在華為雲,人工智能是我們的關鍵戰略。我們正在為每個人、每個行業,構建一個堅實的雲基礎,以推動智能化的發展」。儘管ChatGPT等生成式AI服務,在中國市場備受歡迎,很多中國公司競相推出自己的大型語言模型(LLMs)。但華為堅持將自主研發的盤古人工智能模型,應用於工業領域。去年7月,華為發佈了盤古3.0版本,正式加入了中國雲服務市場的激烈競爭。華為一直在煤礦、鐵路等行業,積極推廣使用自主研發的AI模型。

華為一直在努力與傳統行業和企業,建立更深層次的聯繫,原因在於華為追求更多元化的收入來源,其在雲計算領域中的擴張正體現了這一點。

自2019年以來,美國對華為實施了多項制裁,並將其列入美國實體名單,切斷了華為與美國關鍵技術的聯繫,幾乎使華為在全球智能手機業務上取得的豐厚利潤遭受重創。但根據華為稱,在中國以外的區域,華為雲也取得了快速增長,2022年華為雲業務銷售額達到453億元。

華為輪值董事長胡厚崑,在去年12月的新年致辭中表示,華為雲業務在過去一年取得了穩步增長。根據市場研究機構Canalys的數據,華為已成為中國第二大雲服務提供商,並在全球範圍內不斷擴大其市場份額。去年,華為在土耳其和沙特阿拉伯,分別開設了新的數據中心,以進一步拓展其全球業務。

Google發佈Gemini 1.5:可處理100萬token上下文2 月 21, 2024

Google最近發佈了他們最新的AI模型Gemini 1.5,具備高達100萬token上下文窗口的“試驗性”功能。

Gemini 1.5的新功能,包括能夠輕鬆處理長達100萬token的文本段落,從而更深入地理解上下文及其含義。相比之下,之前的AI系統如Claude 2.1和GPT-4 Turbo,就有些相形見絀了,它們的token處理上限分別是20萬和12.8萬。

Google研究人員在一篇技術文檔中表示「Gemini 1.5 Pro在跨模式的長上下文檢索中,實現了近乎完美的回憶功能。這一突破不僅提升了長文檔QA、長視頻QA,和長上下文ASR的最新水平,還在一系列參數基準上,達到了或超越了Gemini 1.0 Ultra的先進水平。」

Google最新模型的效率提升,主要歸功於創新式的Mixture-of-Experts (MoE)架構。

Google DeepMind 的行政總裁 Demis Hassabis解釋說:「傳統的Transformer功能就像一個大型的神經網絡,而MoE模型則是被分解成更小的‘專家’神經網絡。」這種架構讓模型能夠根據輸入內容的類型,選擇性地激活與其最相關的專家路徑,從而極大地提高了模型的效率。

為了證明Gemini 1.5的強大功能,Google展示了其在處理阿波羅11號飛行記錄(包含32.6914萬token),和啞劇電影(包含68.4萬token)時的表現。在這些示例中,Gemini 1.5不僅能夠準確理解上下文,還能針對具體問題,給出精確的回答。

目前,Google正在向開發者和企業,提供免費的Gemini 1.5有限預覽版,其中包括100萬個token的上下文窗口功能。未來,這一功能將逐步向公眾開放,同時還將推出12.8萬個token版本,並公佈定價細節。

儘管100萬token的功能目前仍處於試驗階段,但如果Gemini 1.5能夠兌現其早期承諾的功能,那麼它有望成為AI理解現實世界中、複雜文本能力的新標杆。

中國將積極參與全球人工智能倫理治理2 月 9, 2024

2024年2月5日,第二屆全球人工智能倫理論壇 (the Second Global Forum on the Ethics of AI),在斯洛文尼亞的克拉尼市開幕。

這次為期兩天的論壇,由聯合國教科文組織主辦,彙聚了來自67個國家的政府代表、國際組織、學術研究機構、非政府組織和企業的600多名與會者,共同探討人工智能倫理的未來發展。

中國教育部副部長王嘉毅,在論壇上發表了意見。他表示,各國提出的人工智能治理計劃,體現了各自的實踐經驗,這為全球共識的達成,和共同治理計劃的制定,奠定了堅實基礎。中國願意傾聽各方意見,與全球夥伴開展深入的溝通、交流和務實合作,共同構建開放、公平、有效的人工智能治理機制,以推動這一技術更好地造福全人類。

此外,一名出席論壇的中國代表也表示,中國將積極參與全球人工智能倫理治理,致力於推動人工智能技術的健康發展,為全人類帶來福祉。

聯合國教科文組織負責社會和人文科學的助理總幹事,Gabriela Ramos在接受新華社採訪時表示,中國不僅制定了一系列措施和法律來監管人工智能,還積極參與國際社會,共同致力於解決AI技術可能帶來的負面影響,以期創造更加美好的科技未來。

Meta宣佈向COS學術研究者共享數據2 月 1, 2024

Meta與Center for Open Science (COS) 宣佈建立新的合作夥伴關係,Meta將向COS的分析師,提供Facebook和Instagram平臺的參與度數據,這些數據經過篩選,並得到隱私保護。本次合作旨在推動與行為和參與度趨勢相關的研究。

跟據COS的介紹,「Meta與COS合作開展試點項目,Meta向COS的精英學術研究團隊,分享經過隱私保護的社交媒體數據,以研究人們的福祉。社交媒體公司如Meta有潛力為公共科學做出貢獻,幫助研究各種因素對福祉的影響,並為人們過上富足充實的生活,提供有益的信息。」

正如COS指出, 初步研究的核心問題,是用戶福祉、以及社交媒體對更廣泛的互動和行為趨勢的影響。

每個項目都將經過同行評審,研究人員需提交有關研究問題和方法的提案,並在數據收集階段開始之前,評估其可行性。

2018年的Cambridge Analytica數據洩露事件後,Meta加強了保障數據安全的措施,並暫停了幾乎所有研究項目。此前,Meta經常參與這類研究。

2018年,Cambridge Analytica將用於劍橋大學學術研究的Facebook數據,出售給政治團體,導致信息被濫用並影響選舉結果。這違反了用戶隱私協議,聯邦貿易委員會 (FTC) 對Meta處以高達50億美元的罰款,並要求其制定新的數據使用法規,和實施更多保護措施,以防止未來再次出現數據濫用現象。

Cambridge Analytica事件,促使Meta徹底改變數據隱私方法,並謹慎地與研究人員展開合作。

考慮到近一半的世界人口使用Meta公司的社交平臺,該公司在提供洞察力方面擁有巨大的價值,可以讓各個領域,在掌握更廣泛的事實的基礎上,取得新的進展。

因此,雖然採取保守的合作方式,但Meta希望能夠再次與更多學術團體合作。

最後,Meta與COS將開展為期兩年的試點項目,並將於未來幾個月,公佈更多合作細節,大家到時候不妨留意。

智譜AI推出新一代大型語言模型GLM-41 月 24, 2024

中國人工智能創業公司智譜AI,最近發佈了新一代基座大模型GLM-4。GLM-4的發佈,充分展示了智譜AI過去三年來取得的技術成果。

據智譜AI的CEO張鵬表示,GLM-4的整體性能得到了顯著提升,已接近OpenAI的GPT-4水平。其中值得關注的性能改善,主要包括,長文本處理能力提升,多模態理解能力增強,並實現更快的反應速度,和更高的實時性,從而大幅降低了推理成本。

此外,智譜AI還表示,GLMs的個性化智能體定制功能現已上線。利用GLM-4模型的強大功能,用戶可以通過簡單的提示詞指令,就能創建自己的GLM智能體,從而有效降低了大型模型的使用門檻。

與此同時,智普AI亦宣佈,已經啟動大型語言模型的開源基金。這一計劃包含全面的基金發放措施,主要包括向大型語言模型開源社區提供1000張AI芯片卡,向與大型語言模型相關的開源項目提供1000萬元現金支持。

其實,智普AI在於2019年成立,而他過去一年裡備受關注,主要因為去年6月,美國科技媒體The Information,將智普AI列為最有可能成為中國OpenAI的五家企業之一,所以今次發佈的GLM-4,勢必讓市場留意。