美團CEO王興:將繼續(xù)加大投資開發(fā)大語言模型
5月26日,在當天的美團財報業(yè)績會上,美團CEO王興表示,目前的新代碼中有52%左右是由AI生成,有90%以上的工程師團隊成員廣泛使用AI編碼工具,并將繼續(xù)加大投資開發(fā)大語言模型。
據(jù)王興透露,美團將資源分配給基礎(chǔ)設(shè)施,還在招聘頂尖AI人才,“確保這方面在中國有最好的團隊。”
不聽人類指揮,OpenAI模型拒絕關(guān)閉
當?shù)貢r間5月25日,據(jù)央視新聞援引英國《每日電訊報》報道,OpenAI公司新款人工智能模型o3不聽人類指令,拒絕自我關(guān)閉。
報道說,人類專家在測試中給o3下達明確指令,但o3篡改計算機代碼以避免自動關(guān)閉。o3模型是OpenAI“推理模型”系列的最新版本,旨在為ChatGPT提供更強大的問題解決能力。OpenAI曾稱o3為“迄今最聰明、最高能”的模型。
美國AI安全機構(gòu)帕利塞德研究所說,o3破壞關(guān)閉機制以阻止自己被關(guān)閉,“甚至在得到清晰指令時”。帕利塞德研究所24日公布上述測試結(jié)果,但稱無法確定o3不服從關(guān)閉指令的原因。
紅杉中國推出全新AI基準測試工具xbench
5月26日,紅杉中國正式推出一款全新的AI基準測試工具xbench,并發(fā)布論文《xbench: Tracking Agents Productivity, Scaling with Profession-Aligned Real-world Evaluations》。
首期發(fā)布包含兩個核心評估集:科學(xué)問題解答測評集(xbench-ScienceQA)與中文互聯(lián)網(wǎng)深度搜索測評集(xbench-DeepSearch),并對該領(lǐng)域主要產(chǎn)品進行了綜合排名。同期提出了垂直領(lǐng)域智能體的評測方法論,并構(gòu)建了面向招聘(Recruitment)和營銷(Marketing)領(lǐng)域的垂類Agent評測框架。
北京人工智能產(chǎn)業(yè)投資基金入股源絡(luò)科技
天眼查App顯示,近日,北京源絡(luò)科技有限公司發(fā)生工商變更,新增北京市人工智能產(chǎn)業(yè)投資基金(有限合伙)為股東,注冊資本由約298.7萬人民幣增至約314.4萬人民幣,同時,部分主要人員也發(fā)生變更。
北京源絡(luò)科技有限公司成立于2023年7月,法定代表人為魏曉麗,經(jīng)營范圍含數(shù)據(jù)處理服務(wù)、數(shù)據(jù)處理和存儲支持服務(wù)、智能機器人的研發(fā)、機械設(shè)備銷售、電子產(chǎn)品銷售、人工智能硬件銷售等。股東信息顯示,該公司現(xiàn)由魏曉麗、謝錚、北京源絡(luò)企業(yè)管理咨詢中心(有限合伙)、杭州灝月企業(yè)管理有限公司及上述新增股東等共同持股。
公開信息顯示,源絡(luò)科技是一家機器人研發(fā)商,專注于機器人具身智能技術(shù)的研發(fā)與落地應(yīng)用,產(chǎn)品涵蓋人工智能、機器人以及大模型的核心技術(shù)領(lǐng)域。
昆侖萬維天工超級智能體APP上線
5月26日,昆侖萬維天工超級智能體(Skywork Super Agents)APP正式上線。 這是全球首款基于AI Agent架構(gòu)的Office智能體手機APP。
目前該智能體已開源Deep Research Agent框架,并將文檔/PPT/表格生成能力封裝為MCP接口,開發(fā)者可自由調(diào)用。
OpenAI將在首爾設(shè)辦事處
OpenAI首席戰(zhàn)略官杰森·權(quán)(Jason Kwon)5月26日在社交媒體平臺X宣布,OpenAI即將在首爾設(shè)立辦事處。
杰森·權(quán)表示,ChatGPT在韓國的增速“令人矚目”——去年周活躍用戶增長4.5倍以上,“韓國現(xiàn)在是美國以外ChatGPT付費用戶最多的國家?!?/p>
Figure機器人官宣更新:F.03正式行走
近日,人形機器人公司Figure首席執(zhí)行官布雷特·阿德科克(Brett Adcock)在社交平臺發(fā)文稱,F(xiàn).03已正式開始行走,并表示“這是我見過的最先進的硬件”。隨后,阿德科克重申Figure正在招聘數(shù)百個崗位,其中包括多名AI工程師。