AI巨頭科大訊飛將在香港投資4億港元,成立國際總部7 月 24, 2024

  • 科大訊飛將斥資4億港元,在數碼港組建一支150人的研發團隊

中國人工智能先鋒企業科大訊飛,7月19日宣佈,將在未來五年內向香港投資4億港元(約合5120萬美元),並已在香港設立國際總部。

在深圳上市的科大訊飛,以其語音識別技術而聞名,其子公司訊飛醫療,已搬入位於數碼港的新辦公室。數碼港坐落在香港南區,是由政府扶持的科技中心。

科大訊飛宣佈,此次投資計劃組建一支150人的研發團隊,專攻大型語言模型(LLMs)及智能語音、教育、醫療領域的AI應用,LLMs是生成式AI服務(如ChatGPT)的核心技術。

科大訊飛副總裁段大為,在新辦公室開幕儀式上透露「我們初期預算設為4億港元,如果香港業務進展順利,預算將會追加。」

段大為稱,隨著新國際總部的成立,科大訊飛計劃將其旗艦產品Spark大型語言模型及語音識別技術,全面推廣至香港企業及本地消費者。

科大訊飛,源自安徽合肥,已成立25年,正計劃與本地公司(如教育和醫療行業的公司)展開合作,共建計算基礎設施,並依託其大型語言模型,定制開發AI應用。

段大為補充道,香港特區立法會已經採用了科大訊飛的實時語音轉文字工具,進行會議記錄。香港還將作為科大訊飛智能教育硬件和服務,走向海外市場的起點,重點瞄準中東和東南亞市場。

科大訊飛此舉強化了香港政府打造科技創新中心的雄心。

2023年8月,香港特區行政長官李家超承諾,將於2035年前建成跨境科技中心,凸顯香港作為內地聯通世界的橋樑地位。

香港特區創新科技及工業局局長孫東,在數碼港的開幕儀式上表示「政府一直大力支持香港創新科技的發展,重點關注AI和生命健康科技。」

即便2019年科大訊飛遭美國列入貿易黑名單,但公司運營仍然蓬勃發展,並加大了對核心AI項目的投入力度。

上個月,科大訊飛透露,其大型語言模型,已完全在其與華為聯合打造的國內計算平臺上,完成訓練,旨在助力中國實現科技自主,並應對美國制裁。

數碼港行政總裁鄭松岩表示「數碼港正在建設一個包括超級計算中心在內的AI生態系統。」他表示,儘管與百度公司的討論已經開始,但科大訊飛也將參與其中。

與此同時,訊飛醫療,計劃設立一個融合健康科技和人工智能的國際研究院。今年1月,科大訊飛透露,計劃在香港為其醫療子公司,進行首次公開募股。

科大訊飛,宣佈在未來五年內向香港投資4億港元,成立國際總部,並組建150人的研發團隊,專注於大型語言模型,及智能語音、教育和醫療領域的AI應用。

此舉旨在推廣其核心技術至香港市場,並借助香港作為跳板,拓展至中東和東南亞市場。同時,也顯示了香港作為科技創新中心的潛力,強化了我們作為內地與國際市場之間橋樑的角色。香港政府對創新科技的支持,包括AI和生命健康科技,吸引了更多企業加大在港投入,定必助力香港實現成為跨境科技中心的目標。

人工智能與自動化,將影響超市與連鎖快餐店7 月 17, 2024

近年來,人工智能不僅在科技領域掀起創新熱潮,食品行業也在這一火熱趨勢中,投入了大量資金。

美國消費者在光顧超市及心儀快餐店時,已經注意到了新技術的引用,包括自助結帳機,和得來速通道的AI點餐服務。

在食品價格不斷攀升的當下,美國消費者正積極尋求各類優惠,並相應地調整消費習慣。面對競爭壓力,食品行業正大力投資人工智能領域,以期削減高昂的人力成本,並降低部分商品的價格。

例如,麥當勞、Taco Bell和Wendy’s等快餐連鎖店,重新推出了優惠菜單。而大型零售商如沃爾瑪和Target,則降低了一些食品的價格。

「在當前環境下,想要實現高利潤、高銷售額,並保持客戶滿意度,是非常困難的,」GlobalData的總經理和零售分析師Neil Saunders說道。「這是一個很難達到平衡的方程式。我認為,如果經濟形勢不發生變化,那麼這個平衡將難以真正實現。這就是現實。」

面對當前嚴峻的經濟形勢,麥當勞在今年宣佈了一項計劃,將斥資20億美元在其餐廳和得來速通道,引入人工智能與機器人技術。而根據食品行業協會(FMI)的研究,2022年,超市行業在技術自動化領域的投入,已高達130億美元。FMI預測,至2025年,如智能購物車、優化升級的自助結帳通道等創新技術的投入,將激增400%。

「未來幾年,我們將看到很多積極方面,人工智能和技術能夠增強客戶體驗,同時簡化團隊成員的工作,」Yum Brands的首席數字與技術官Joe Park說道。

想要瞭解食品行業如何利用人工智能重塑客戶體驗,請觀看本視頻

 

阿裡雲新廣告宣傳AI算力,獲大客戶背書7 月 10, 2024

阿裡雲與競爭對手,紛紛將目光投向今年預期增速更猛的市場。這一趨勢轉變,部分歸因於生成式AI的盛行。

7月8日,阿裡巴巴集團旗下的阿裡雲,啟動了一項新的廣告宣傳活動。廣告中出現了兩位新晉「代言人」,分別是初創公司月之暗面(Moonshot AI)的創始人,和智聯招聘的集團總裁。

新系列代言廣告,目前在首都機場和杭州機場進行展示。標語「我用的雲是阿裡雲」 響亮登場,彰顯阿裡雲作為業界先鋒,支持人工智能開發的卓越能力。

廣告中,中國「新AI猛虎」月之暗面創始人楊植麟,盛讚阿裡雲,稱其「強大計算能力」與「大模型服務平臺」顯著提升了Kimi模型的效率。

阿裡巴巴作為月之暗面的重要後盾,斥資約8億美元收購了其36%的股權。去年十月亮相的Kimi聊天機器人,由月之暗面自主研發的模型提供驅動,並被寄予厚望,視為中國對OpenAI ChatGPT的有力回應之一。

另一則廣告中,智聯招聘集團總裁張月佳,對阿裡雲讚譽有加,稱其幫助公司在人力資源應用中,迅速採用大型AI模型。

放眼市場,自去年起,中國雲計算市場硝煙四起,各大巨頭競相降價,以爭奪從大型企業到中小型企業的客戶。

歐盟正調查微軟與OpenAI及谷歌與三星之間的AI交易7 月 3, 2024

歐盟加大了對AI交易領域的反壟斷審查力度,首要目標是調查微軟與OpenAI、及谷歌與三星之間,引人注目的合作。

歐盟委員會執行副主席兼競爭專員Margrethe Vestager,此前警告稱,「AI正在以驚人的速度發展」,並透露正在對各種與AI相關的市場行為,進行初步調查。她對潛在反競爭行為的憂慮,主要源自ChatGPT橫空出世後,主流科技公司在AI領域內採取的一系列舉措。

委員會的行動表明,在迅速發展的AI領域,歐盟日益關注科技巨頭可能形成的壟斷力量。審查的重點,包括近期在AI領域中,微軟和谷歌達成的交易和合作。這些操作行為通常涉及到戰略合作和收購,並引起了監管機構的關注。原因在於這些行為可能會削弱競爭、有損創新。

儘管並未透露具體細節,Vestager強調,委員會目前正在對AI相關市場內的各種行為,進行多項初步反壟斷調查。

微軟與OpenAI的合作夥伴關係

微軟與OpenAI建立的數十億美元合作,堪稱AI領域的標誌性聯盟。從2019年開始,該合作不斷深化,微軟不僅鉅資注入OpenAI,還依託Azure雲提供強大算力支持,並將OpenAI的前沿技術,無縫融入自身產品服務中。

該合作旨在加速對AI的研究和開發,成果斐然,如GPT-3以及最新版本的ChatGPT。然而,這一聯盟引發了有關市場主導地位,和小型AI企業准入障礙的擔憂。Vestager在演講中表示,歐盟委員會,去年開始審查該交易是否違反了歐盟《合併規則》,但終因認定微軟未掌控OpenAI而暫停調查。

「多年來,微軟已向OpenAI投資了130億美元。但我們必須確保這樣的合作夥伴關係,不會成為一方對另一方施加控制性影響的偽裝」她表示,同時暗示委員會將採取另一種方式,來審查該交易及整個行業。委員會正在使用歐盟的反壟斷法規,嚴控市場領頭羊的濫用行為。

另一個焦點:谷歌與三星的合作

谷歌與三星的AI相關合作,也引起了重大關注。該合作利用三星的硬件能力和穀歌的AI技術,開發出具有創新性的消費電子產品和移動技術。其中包括將穀歌的AI算法整合到三星設備中,優化語音識別、相機功能,和個性化用戶體驗等特性。

雖然這一合作,有望為廣大消費者帶來先進的、由AI驅動的性能,但也引發了關於競爭公平性的質疑,特別是對於關鍵技術的訪問和市場影響力。Vestager表示,歐盟監管機構已發出信息請求,旨在深入瞭解谷歌與三星的合作,特別是Gemini Nano(穀歌Gemini AI基礎模型精簡版)在三星設備上的預裝情況及其市場影響。

接下來會如何發展?

隨著微軟、穀歌等科技巨頭,在全球AI領域通過收購與合作,不斷擴張其影響力,監管機構對市場主導地位的關注日益加深,擔憂其對公平競爭造成的潛在影響。這一趨勢,預示著歐盟未來必將加強監管和干預。

對此,微軟與谷歌重申了將嚴格遵守監管規定的承諾,並堅持在AI技術領域內,負責任地推進創新。兩家公司共同強調了其AI計劃所帶來的潛在益處,特別是在醫療保健、可持續發展,及其他關鍵領域的積極進展。

然而,歐盟的反壟斷審查結果,或將深刻影響主要科技公司,在歐洲AI市場的運營格局。此舉或催生一系列監管措施,旨在構建一個更加公平的競爭環境,確保小型競爭對手也能享有平等的競爭與創新機遇。

 

中國公共部門正積極採用人工智能,智譜和科大訊飛嶄露頭角6 月 26, 2024

  • 2024年上半年,有81個涉及使用大型語言模型(LLM)的公共項目,競標成功。而去年同期,僅有一個項目成功競標。

政府數據顯示,今年以來,中國大型企業加快了採用人工智能的步伐。上半年,相關項目的合同數量激增。根據中國政府採購網和中國招標投標公共服務平臺,網站上公佈的數據,從第一到第二季度,涉及使用LLM的招標合同數量,大幅增長——前三個月為23個,4月至6月24日為58個。這些合同都使用了「大模型」這個關鍵詞。

LLM技術是一種支持對話式的人工智能機器人,如OpenAI的ChatGPT。2022年底,由微軟支持的OpenAI,推出廣受歡迎的聊天機器人。自此,中國的科技公司,也競相推出數百種自主研發的LLM,以及以LLM為運行基礎的產品。網站顯示,2023年上半年,與LLM相關的招標合同僅有一個,而在去年的第四季度,這個數字有所增加。

 

由於只有涉及公共利益和安全、公共資金或外國公司貸款的項目,才需要公開披露,因此這些合同反映了中國大型企業的業務重心。百度、華為、騰訊等科技巨頭,以及一些資金充足的初創公司,在上半年都成功中標。

這些數字可以讓人們初步瞭解AI在中國日益發展的情況、誰在這一領域取得了最大進展,以及這些技術應用於哪些行業。

能源、電信、金融和科研等相關部門,最希望能夠利用LLM的潛力。這些行業所涉及的項目數量分別是19、14、12和10個。

北京某區的環境保護部門,購買並定制了LLM,來幫助他們預測洪水情況。中國核動力研究設計院和中國招商證券,利用智譜AI(總部位於北京的初創公司)所開發的LLM,從其多年運營所積累的素材中,提煉出知識和技巧,從而促進員工的工作便利。

中國能源巨頭,正運用LLM來發現電網和石油勘探設備的潛在問題。

中標最多的並不是中國的傳統互聯網巨頭,而是被譽為「中國AI四虎」的智譜AI。今年,與LLM相關的競標合同中,智譜AI中標最多,達12個。以語音識別技術著稱的科大訊飛,成功中標了10個合同,這些合同主要來自國有企業和政府機構。百度和華為分別中標了五個和三個合同。

從月度來看,第二季度LLM合同招標的速度顯著加快。一月、二月和三月分別有9個、5個和9個合同,成功中標。四月,這一數字躍升至20個,五月為24個,六月則有14個。此外,81個合同的總價值為人民幣4.33億元,平均每個合同約530萬元。

NVIDIA 在CVPR大會上展示視覺AI的最新進展6 月 19, 2024

計算機視覺和模式識別(CVPR)大會,於6月17日至21日在美國西雅圖舉行。NVIDIA研究人員在大會上,展示了最新的視覺生成AI模型和技術。這些研究成果包括定制圖像生成、3D場景編輯、視覺語言理解,和自動駕駛感知等領域。

「人工智能,尤其是生成式AI,代表了一項關鍵的技術進步。在CVPR大會上,NVIDIA 研究部門展示了我們是如何突破極限的——包括為專業創作者提供強大助力的圖像生成模型,和幫助實現下一代自動駕駛汽車的自動駕駛系統。」NVIDIA學習和感知研究部門的副總裁Jan Kautz說。

在50多個NVIDIA研究項目中,有兩篇論文入選CVPR最佳論文獎候選名單——其中一篇探索了擴散模型的訓練動態,另一篇則探討了自動駕駛汽車的高清地圖。

此外,NVIDIA在CVPR自主駕駛大獎賽的“規模化端到端駕駛”比賽中勝出,從全球450多個參賽項目中脫穎而出。這一里程碑式的成果,展示了NVIDIA在使用生成式AI,進行綜合自動駕駛車輛模型方面,所進行的開創性工作,並由此獲得了CVPR的創新獎。

其中一個研究亮點是JeDi 技術。JeDi 是一項允許創作者快速定制擴散模型的新技術——這種方法是目前文本生成圖像的主流方式。無需在自定義數據集上耗時地微調,只需使用少量的參考圖像,JeDi就可以呈現特定的圖像或角色。

另一項突破性技術是FoundationPose 模型。這是一種新的基礎模型,能夠在不進行逐個對象訓練的情況下,瞬間理解和追蹤視頻中物體的3D姿態。這項技術打破了性能的新記錄,並有望解鎖新的增強現實(AR)和機器人應用。

NVIDIA研究人員還介紹了NeRFDeformer。這將簡化使用單個RGB-D圖像轉換NeRFs的過程,以及簡化將捕獲的2D圖像更新為3D場景的過程。

在視覺語言方面,NVIDIA與麻省理工學院(MIT)合作開發了VILA。這是一系列新的視覺語言模型,在理解圖像、視頻和文本方面,達到了業界領先水平。憑藉推理能力的提升,VILA甚至可以通過結合視覺和語言理解,來解讀網絡圖梗。

NVIDIA的視覺AI研究跨越多個行業,其中十多篇論文探討了自動駕駛感知、導航和規劃的新方法。NVIDIA的AI研究團隊副總裁Sanja Fidler展示了視覺語言模型在自動駕駛汽車領域中的潛力。

NVIDIA在CVPR大会上所呈现的廣泛研究,展示了生成式AI能够賦能創作者,加速製造業和醫療保健的自動化,同時推動機器人技術的發展。

 

快手發佈強大的視頻生成大模型「可靈Kling」6 月 12, 2024

近日,由中國視頻公司快手(Kuaishou)開發的可靈(Kling) AI 視頻模型,正式上線。其特性與今年年初OpenAI 發佈的 Sora,有許多相似之處。主要功能包括生成更長的視頻、更合理的動作,以及多序列鏡頭,並且能更好地遵循指令。與 Sora 不同的是,Kling 已經推出等候名單,並開始向用戶開放。

OpenAI在二月份推出了Sora,並逐漸受到創作者的青睞,其中包括五位獲獎電影製片人,他們將在翠貝卡電影節(Tribeca Film Festival)上,首映Sora製作的短片。儘管如此,Sora 仍未向公眾廣泛開放。

關於Kling 的介紹

根據快手表示,Kling 可以根據單一指令生成視頻,其生成的視頻分辨率高達1080p,時長最高可達2分鐘(幀率30fps)。它還能「精確地模擬物理世界的特性」,這是大多數 AI 模型難以實現的功能。Kling採用了類似 Sora 的技術路線,使用專有模型,支持多種縱橫比和鏡頭類型。

官網上顯示,除了生成特性以外,Kling還具有先進的臉部和身體的3D重建功能,可以改進視頻中的所有表情和肢體動作。

Kling 所做的視頻如何?

這些視頻中,最令人印象深刻的特點是真實性。在一些片段中,也會存在像其他 AI 視頻中,所出現的模糊現象,但模糊程度較輕。在一段鸚鵡的視頻中,你幾乎分辨不出它是否是真的,而且你也很難確定那段吃漢堡的視頻是否是真實的。

總體來看,Kling 能夠創建精准的動作,更好地模擬現實世界的動作和物理特性,並且能夠將現實世界的真實感重現出來。

這對 Sora 意味著什麼?

如果快手公司考慮在更廣泛的區域發佈Kling,讓中國以外的用戶能夠使用,那麼這種競爭,將有助於激發創造力和創新。Kling的發佈,相信也會推動 OpenAI 儘快發佈 Sora。

上海研究人員開發出更精確的AI氣象預報大模型6 月 4, 2024

6月3日,上海科學智能研究院和復旦大學,聯合發佈了全新升級、AI 驅動的氣象預報大模型——伏羲2.0。

與之前的模型相比,伏羲2.0 的預測準確性更高,預測速度僅為傳統數值模式的1/1000,同時成本更低,可預測的時間更長。

預計在它的幫助下,中國的早期預警、風險管理,和災害防禦能力,將得到顯著提升。

上海科學智能研究院院長漆遠表示「氣候變化導致極端天氣頻發,因此天氣預報急需改進。伏羲2.0 可以提供更準確和及時的預測,從而減輕極端天氣帶來的災害」

上海科學智能研究院地球科學負責人李昊強調,伏羲2.0 在極端天氣現象預測方面,取得了重大突破,其準確性超過了歐洲中期天氣預報中心(ECMWF)的短期和中期模型。

去年12月,伏羲1.0首次亮相第28屆聯合國氣候變化大會(COP28),成為中國首個能夠預測未來15到60天預報的次季節大模型。

李昊表示,伏羲2.0 可以實現全國範圍內,1公里高分辨率地面氣象要素預報,同時能夠做到每小時更新一次預測結果——相較于現有模型的10到25公里的分辨率,這是一個巨大的進步。

對於新能源領域,伏羲2.0 能夠提供更準確的風速、輻照和發電預測,優化風電和太陽能發電,改善電網負荷平衡,並減少棄風棄光現象。李昊說「伏羲2.0如同風電場和太陽能電站的智能導航系統」

航空領域可以利用伏羲2.0,對低雲量和總雲量進行預測,同時有助於預測積冰、顛簸、光線明暗不均等現象——這些天氣現象會影響飛行體驗和成本。

上海科學智能研究院,攜手氣象服務、科研組織及行業領軍者等10家機構,共同宣佈成立智能氣象創新生態聯盟。

該聯盟將依託伏羲2.0,深化研究、教育與行業之間的合作,推動智能天氣預報技術邁向新高度。

Instagram正在嘗試使用熱門表情包的新方式5 月 29, 2024

Instagram希望借助參與性內容,並簡化用戶間的互動流程,來鼓勵用戶,在平臺上發佈更多帖子。此次採用的方式是利用熱門表情包。

如圖所示,Instagram在Reels編輯工具中,開發了一個新的Memes選項,該功能可以讓用戶在視頻中,添加當下熱門的表情包。

Memes能夠提供一系列熱門表情包動圖,同時可以將表情包添加到Reels上,讓用戶發佈的內容,更具話題性和吸引力。

這項功能,讓用戶能夠輕鬆地運用熱門表情包模板,因此很有可能成為一項深受用戶喜愛的功能。當然,Instagram還需定期更新表情包,從而保持表情包的關聯性。同時,該功能簡化了用戶使用表情包的過程,有助於促進用戶發佈更多原創內容。

這項功能的推出,其實在意料之中。早在去年十二月,Instagram就添加了Stories 模板,方便用戶創建自己的「可以變成表情包的」Stories,從而有助於激發更多互動。

最開始推出參與性表情包功能的,其實是TikTok。TikTok通過Duets和其他與內容創作相關的功能,讓用戶可以輕鬆地跟上並利用當下流行趨勢。此外,由於TikTok發佈的內容一般是公開的,所以人們在app中可以獲得更多曝光。而 Instagram 則更私密,更以用戶間的連結為基礎,因此無法像TikTok那樣完全支持此功能。

但Instagram 正在努力解決這一問題。因為,儘管Instagram的使用率持續上升,但用戶發佈原創內容的頻率卻有所降低。這意味著,雖然人們在app中觀看的視頻更多,但他們發佈的內容卻更少。從短期來看,這可能不是問題,因為更長的使用時間,意味著更多的廣告曝光,和更高的收入。但是,如果創作者停止發佈內容,Instagram 就會失去吸引用戶的原創內容。而 Meta 也深知,想要推進元宇宙項目,就需要創作者的扶持。

Instagram希望用戶發佈更多參與性內容,因此一直在探索鼓勵人們在app中分享和互動的方法。

重視表情包的功能發揮,或許能成為實現這一目標的有效方式。

阿里、百度雲爭先支持Meta開源大模型Llama 34 月 24, 2024

  • Meta發佈Llama 3後,阿里雲第一時間在其開源模型社區——魔搭社區——中上架Llama 3。魔搭社區,旨在為開發者提供一系列開源AI模型的訪問權限。
  • 在國內主流科技公司中,百度率先採取了支持行動,在其千帆大模型平臺中,推出了針對Llama 3的訓練和推理服務。

繼Llama 3公佈可用於訓練ChatGPT類聊天機器人後,國內科技巨頭如阿里巴巴、百度等,紛紛在各自雲平臺上,率先支持Meta的Llama 3大型語言模型。

阿裡雲除了在魔搭社區中上架Llama 3以外,還在其微信公眾號上的一篇文章中表示,阿里雲百煉平臺,將推出針對Llama 3的免費訓練、部署和推理方案,但並未公佈詳細時間安排。

百煉平臺是一個LLM服務平臺,為客戶提供一系列工具和服務,幫助客戶利用阿裡巴巴的雲計算服務,構建和訓練自己的模型和應用程序。

此前,作為搜索引擎巨頭、人工智能先驅的百度,已宣佈其在Meta模型發佈後,立即推出了對Llama 3的支持。

在Meta推出Llama 3的轉天,百度就成為國內首家對其提供支持的科技公司,在其千帆大模型平臺中推出了針對Llama 3的訓練和推理服務。

千帆大模型平臺,旨在幫助企業客戶構建、訓練和擴展適應其需求的人工智能模型。平臺所提供的模型,包括由百度開發的文心大模型,以及來自本土和海外公司的第三方開源模型(如Meta的Llama系列)。

據百度稱,千帆大模型目前支持79個人工智能模型,服務8.5萬名客戶,已經成功開發出超過1.4萬個模型和19萬個應用程序。

百度還表示,通過利用集數據管理、模型微調、模型評估和優化,以及推理服務部署于一體的開發平臺,千帆大模型用戶將能夠以更低的成本,開發出高於基礎模型能力的新模型。