DeepSeek的崛起之路:AI大模型創業格局報告_第1頁
DeepSeek的崛起之路:AI大模型創業格局報告_第2頁
DeepSeek的崛起之路:AI大模型創業格局報告_第3頁
DeepSeek的崛起之路:AI大模型創業格局報告_第4頁
DeepSeek的崛起之路:AI大模型創業格局報告_第5頁
已閱讀5頁,還剩47頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

微信公眾號:零豎質量2022年11月ChatGPT發布,引爆國內百模大戰,創業玩家如雨后春筍,互聯網巨頭也紛紛下場,巔峰時期國內公開大模型數量超越300個。如今一年半過去,巨頭們依托固有業務,更早形成壁壘,率先晉級。而創業玩家這邊,勝局也已鎖定,,目前或許只有少數幾家公司拿到了和巨頭角逐下半場的門票。他們分別是

——智譜AI、MiniMax、階躍星辰、百川智能、月之暗面和零一萬物,這六家公司背后都轉起了一個關鍵飛輪——模型、應用和融資飛輪,這使得他們能夠與巨頭同場競技。另外,這一賽道上還有

——面壁智能和

DeepSeek。許多人認為,繼移動互聯網之后的AI時代,新的他們共同組成了巨頭或將從這八家公司中誕生。而放眼全球,美國大模型行業同樣存在類似的階段性競爭格局變化,像曾經的移動互聯網時代一樣,中美再次在兩個“平行宇宙”中上演新的歷史進程……在本篇報告中,量子位智庫將以一個逐步放大的視角,從國內創業玩家“6+2”格局、國內巨頭玩家格局、海外玩家格局三個層次,力求為讀者描繪大模型行業格局完整畫卷。微信公眾號:零豎質量微信公眾號:零豎質量微信公眾號:零豎質量分類 創始人模型C端產品B端產品最新估值學院派唐杰GLM智譜清言、清影API、云端私有化、本地私有化約30億美元青年派閆俊杰abab星野、海螺、TalkieAPI約25億美元楊植麟MoonshotKimiAPI約30億美元大佬派姜大昕Step躍問、冒泡鴨AI金融、AI內容創作約20億美元*王小川Baichuan百小應、健康顧問MaaS+AaaS行業解決方案超20億美元李開復Yi-數字人解決方案全行業ToB解決方案、AI

Infra解決方案超10億美元模型創始人DeepSeek

梁文鋒模型 創始人MiniCPM李大海劉知遠創業特別關注創業六小強2019.06智譜AI成立2021.12MiniMax成立2022.08面壁智能成立2023.04.06階躍星辰成立2023.04.10百川智能成立2023.03月之暗面成立2023.05.16零一萬物成立2023.07.17深度求索成立2020.06.11OpenAI發布GPT-32022.11OpenAI發布ChatGPT,引爆百模大戰*為投前估值國內創業玩家“6+2”格局總覽微信公眾號:零豎質量國內創業玩家核心競爭力四維度模型在模型維度上,本章將根據各家創業公司特點有側重地介紹其研發歷程、模型能力特點、架構特色、矩陣構成、Benchmark成績、AGI路徑規劃等情況中的一到三項。競爭力維度具體內容應用在應用維度上,本章將根據各家創業公司特點有側重地介紹其大模型應用矩陣、特色應用、主力應用、實現功能、用戶數據、戰略特點、生態布局、付費模式等情況中的一到三項。團隊在團隊維度上,本章將介紹各家創業公司核心團隊成員情況,具體包括教育背景、學術影響力、重要頭銜、相關工作履歷等信息。融資在融資維度上,本章將介紹各家創業公司融資歷程,具體包括歷次融資時間、輪次、金額、估值及投資機構。微信公眾號:零豎質量微信公眾號:零豎質量脫胎于高校實驗室,技術成熟自然轉化:智譜AI脫胎于清華KEG實驗室,是清華計算機系技術成熟到一定程度的轉化成果,于2019年6月正式成立,2022年8月發布自研百億參數大模型GLM,彼時GPT-3.5還未發布。自研底層框架打破壟斷,矩陣全面對標OpenAI:2022年3月,唐杰團隊提出了全新自研的通用預訓練框架GLM,打破當時西方壟斷主流大模型預訓練框架技術路徑的局面。智譜AI在模型和產品矩陣甚至投資策略上均對標OpenAI,最新的GLM-4基座大模型能力多方位接近世界領先水平。智譜AI——模型:清華系成果轉化,自研底層架構,對標OpenAIOpenAIvs智譜1996清華KEG實驗室成立致力于網絡環境下知識工程理論、方法和應用研究2015.12OpenAI正式成立2022.08智譜發布開源千億大模GLM-130B,效果對標GPT-3175B2021智譜百億參數大模型

GLM發布,采用全新預訓練模型框架2020.06OpenAI發布GPT-32019.06智譜AI正式成立2022.12OpenAI發布GPT-3.5,引爆百模大戰2023.08智譜上線AI助手應用“智譜清言”2024.01智譜發布最新一代基座大模型GLM-4性能達到國際領先水平2024.07智譜發布視頻生成功能“清影”智譜GLM-4(0520)在GSM8K、MATH、BBH、GPQA、HumanEval等多個國際主流Benchmark上成績超過GPT-4(0314)。信息來源:智譜及公開信息整理面壁智能、生數科技、無問芯穹等bigmodel.aiDALL·ESoraCodexGPT-4oplatform.openaiChatGLM智譜清言CogViewCogVideo清影CodeGeeXCogVLMgptstore智譜清言智能體中心Helion、Rain

AI、Anthropic等ChatGPTGPT應用產品底層框架圖像生成視頻生成代碼多模態MaaS平臺Agent開發平臺產業投資GLM微信公眾號:零豎質量智譜AI——應用:工程基因,側重ToB,商業化進程身位領先ToB基因突出,主打MaaS平臺:智譜脫胎的清華KEG知識工程研究室自90年代就強調工程落地,造就了團隊將技術落地到需求中的做事風格。智譜團隊以ToB背景為主,商業化重心在B端,智譜大模型開放平臺目前已有超40萬的企業用戶,主要覆蓋金融、教育、互聯網、零售、汽車、能源、傳統制造業等行業。ToC側重生產力應用,視頻生成功能“清影”上線:智譜ToC業務目前仍以免費為主,主力應用“智譜清言”,截至2024年6月歷史下載量突破500萬,同時智譜清言也是智能體開發平臺,目前已有超過30萬個智能體活躍在智譜清言APP可供使用,2024年7月新上線視頻生成功能“清影”,對標Sora,免費公開使用不限次。智能座艙售后服務市場營銷研發制造AI汽車AI手機售后服務生活服務助手AI醫療AI金融AI旅行AI

BIAI陪伴

AI導購

AI客服AI質檢

AI供應鏈

AI風控

AI營銷其他智譜清影AI生成視頻功能網頁端依據量子位智庫發布的《AI智能助手APP

8月榜單》,智譜的ToC主力應用智譜清言下載量突破500萬,位列第七。(完整報告數據請查看量子位智庫公眾號)API單日調用量600萬+信息來源:智譜及公開信息整理API單日調用tokens400億+服務企業客戶30萬+融資金額及估值處于第一梯隊:智譜是目前國內估值最高的大模型初創公司之一,最新一輪融資估值報據傳為30億美元,從團隊背景、模型開發進展、商業化方向及資金儲備情況來看,公司處于國內AI創業公司頭部。積極布局產業生態,投資多家技術優勢公司:為打造自己的AI大模型生態圈,智譜參與了十多家AI大模型產業相關創業公司的投資,被投企業多為清華系,且以技術導向為主。信息來源:智譜、相關報道及公開信息整理智譜AI——融資:融資輪次多、估值領先,全產業鏈投資積極布局生態投資機構時間2024/09輪次B+輪金額數十億估值200

中關村科學城2024/05

B+輪約

4

億美元

30

億美元Prosperity7

Ventures2024/03B+輪-

-順禧基金2024/01B+輪-

-光速光合2023/10B+輪-

-螞蟻集團2023/09B+輪12億25億2023/07B+輪約3億40億2023/05B+輪約4億40億2022/09B輪約2億20億2021/09A輪約1.5億-2021/04天使輪--2019/08種子輪--好未來、小米、紅杉、美團、訊投資、金山軟件、阿里巴巴、順為資本、高瓴資本、君聯資本美團今日資本,螞蟻金服,光速中國啟明創投,君聯資本,華控基金圖靈創投、凌云光、華控基金、將門創投、海南智橋、

IMO

Ventures、達晨財智、北京榮品北京創新智源科技有限公司中科創星、華控技術轉移有限公司、清控資管集團發起總額為10億人民幣的大模型創業基金,支持大模型原始創新,覆蓋大模型算法、底層算子、芯片優化、行業大模型和超級應用等各方面。對創業者分別聯合CCF中國計算機學會、中國中文信息學會社會媒體處理專委會發起了CCF-智譜大模型基金、SMP-智譜大模型交叉學科基金,用于支持大模型理論、算法、模型、應用等相關研究和跨領域交叉創新。對學術界成立大模型開源基金,計劃累計用1000張GPU、1000萬人民幣和1000億tokens來支持人工智能開源社區建設。對開源社區智譜投資布局依托清華AI人才資源:截至2024年9月,公司員工共計600余人,其中大模型研發人員接近半數,其余為客戶服務落地人員及產品人員。公司借助清華系高校背景,持續吸引高端人才。團隊具備從研發到落地全棧能力:公司團隊源自清華知識工程研究室KEG,該實驗室自90年代成立起就走的是“科研+工程化落地”路線,團隊成員具備深厚技術積累及綜合運營經驗;創始人唐杰教授是認知智能領域頂尖專家,具備20余年人工智能領域研究經驗。信息來源:智譜及公開信息整理智譜AI——團隊:學院派代表,清華計算機系人才眾多王紹蘭總裁曾任清華數據科學研究院科技大數據研究中心副主任凹凸科技北京公司總經理獲得授權發明專利15項,美國發明專利2項20余年技術和政府項目綜合經驗清華數據科學研究院科技大數據研究中心副主任中科院計算所博士,師從高文院士獲得授權發明專利40余項,國際標準一項劉德兵董事長張鵬

CEO清華計算機系本碩博,中國新聞信息標準化分會委員電子學會標準化工作委員會機器人技術委員會委員在ICML、ISWC等頂級會議上發表10余篇文章唐杰創始人

技術顧問清華大學計算機科學與技術工學博士、IEEE

Fellow清華大學計算機系教授,研究方向知識圖譜曾主導開發全球最大萬億級超大規模預訓練模型悟道張帆

COO巴黎第十一大學計算機碩士、法國梅斯大學計算機碩士曾任大搜車集團CTO,曾創立元因智能任CEO,創立妙計旅行任CEO,是智能技術領域連續創業者曾在字節,

訊,搜狗從事技術管理工作信息來源:MiniMax及公開信息整理MiniMax——模型:選擇混合專家架構技術路徑,打造多模態模型Dense稠密模型MoE混合專家模型由自注意力機制層(SA)和前饋神經網絡層(FFN)組成,每一層都與前層直接相連。每次前向傳播中所有的參數都被激活和使用,需要的計算量和顯存更大。自注意力機制層(SA)后接了多個前饋神經網絡層(FFN)。在每次前向傳播中,由路由機制選擇性激活部分FFN。可減少計算量和顯存需求,同時提高模型在同等條件下的靈活性和容量。模型架構對比主流測試集成績視頻大模型abab-video-1壓縮率高、文本響應好、風格多樣,支持原生高分辨率、高幀率視頻音樂大模型abab-music-1支持多功能端到端音樂生

成,可合成多種音樂形式,支持伴奏人聲同時生成語音大模型abab-speech-1支持粵語、韓語、?班牙語等多語種,生成語句超擬人,情緒細膩自然模型矩陣單日交互次數30億次日均處理

Tokens3萬億abab

6.5系列包含兩個模型:abab

6.5和a

b

a

b

6.5s。在各類核心能力測試中,abab

6.5開始接近

G

P

T-4、C

l

a

u

d

e-3、Gemini-1.5等世界上最領先的大語言模型。abab

6.5與世界領先語言模型在多個開源測試集上的成績對比國內最早研發MoE及Linear

Attention:2023年6月,MiniMax在MoE混合專家架構仍是行業非共識時選擇AllinMoE,彼時行業大部分公司仍在訓練Dense稠密模型。2024年1月,MiniMax發布千億參數MoE架構模型;4月底,推出萬億參數MoE架構模型。即將發布的abab

7模型將基于MOE+Linear

Attention。圍繞產品需求打造全矩陣多模態模型:截至2024年9月,MiniMax已推出視頻大模型、音樂大模型及語音大模型,最新主力模型abab6.5在多項核心能力上開始接近世界最領先大語言模型水平。信息來源:MiniMax、Sensor

Tower及公開信息整理MiniMax——應用:以娛樂陪伴方向為主,專注打造超級應用海外Talkie:Talkie于2023年6月上線,主要面向北美市場。產品玩法與星野類似,用戶可以定制AI智能體的形象、聲音、人設、技能,并進行卡牌抽取及交易。根據Sensor

Tower數據,Talkie

2024年H1在美國市場累計下載量380萬次,位列美國同類AI產品排名第一,超過Character.AI。目前Talkie全球月活數據已達到1100萬,一半以上用戶來自美國,與Character.ai月活數據1700萬的差距逐漸縮小。國內星野:星野于2023年9月上線,用戶可以在星野上通過簡單描述定制AI智能體的形象、聲音、人設、技能,并在后續對話中不斷調整強化。也可以選擇首頁推薦的數百萬款由用戶創建的智能體進行多模態沉浸式互動。此外,星野還探索了訂閱制和抽卡制的付費模式、以寶石為主的經濟體系和以星念為中心的用戶共創激勵體系。依據量子位智庫發布的《AI陪伴8月APP榜單》,星野APP下載總量超1400萬,月新增下載及DAU均位列國內同類AI產品第一。生產力應用海螺AI:海螺AI于2024年5月上線,支持多種交互方式:可以發送文字消息、上傳圖片、PDF、PPT、TXT、DOCX等格式文件,支持語音通話。8月下旬最新開放音樂創作與視頻創作入口,可由此進入海螺音樂及海螺AI創意視頻平臺,調用海螺視頻生成大模型能力。API開放平臺角色扮演AI客服聊天問答AI招聘智能硬件AI教育AI辦公AI零售落地場景ToC打造超級應用工廠:MiniMax是國內創業公司里做應用產品最早、最多的公司,2022年早于ChatGPT一個月上線Glow,又陸續推出了AI內容平臺應用星野、

Talkie,以及生產力助手海螺AI。8月最新發布海螺AI創意視頻平臺,可調用最新視頻生成模型,視頻生成能力尤其是人物表情生成方面受到海內外好評。ToB布局開放平臺:ToB方向布局API開放平臺,目前已接入3萬余家企業客戶,主要落地場景包含零售、教育、辦公、智能硬件、招聘、客服、聊天等。估值高、投資門檻高、融資金額高:MiniMax作為國內大模型創業六小強中唯二在ChatGPT爆火之前就成立的大模型公司,很早就吸引了頭部機構注意,目前已集齊阿里、紅衫、高瓴、經緯、IDG、順為、明勢、云啟一眾頭部機構,估值約25億美元。人才技術實力強,產品經驗豐富:創始人兼CEO閆俊杰具備豐富的技術、產品和商業化管理經驗,核心技術團隊擁有世界頂尖自然語言處理、語音、計算機視覺、計算機圖形學等工業和學術經驗。信息來源:MiniMax及公開信息整理MiniMax——融資&團隊:率先晉升獨角獸,Under

35創始人帶隊時間輪次金額估值投資機構2024/03A輪6億美元25億美元阿里巴巴、紅杉中國、高瓴投資、經緯創投2023/06A輪2.5億美元12億美元騰訊投資、綠洲資本、小紅書、順為資本、高瓴投資、IDG資本2022/07A輪-超2000萬美元IDG資本、明勢資本、高瓴創投、米哈游2022/01天使輪--云啟資本閆俊杰創始人、CEO中科院自動化所博士,在人工智能頂會及核心期刊發表論文200余篇,谷歌學術被引用超3萬次曾任商湯集團副總裁,從零打造通用計算機視覺模型、深度學習工具鏈和人臉識別相關的技術體系 獲得多項重要獎項和榮譽,包括超過10次重要國際學術競賽的冠軍,廣東省技術發明一等獎,兩次吳文俊人工智能二等獎等魏偉合伙人開放平臺業務負責人曾任訊云副總裁,百度技術總監,中國云計算領域的早期貢獻者涉足技術和業務兩大領域,早在2011年就開始使用GPU驅動深度學習,支持算力平臺的發展團

贠燁祎隊

聯合創始人、COO成員

畢業于約翰霍普金斯大學,主修電子計算機工程、數學和經濟,主研深度學習在醫療影像領域的技術和應用

曾任商湯科技投融資經理、戰略/國際化總監、創新業務總經理,負責集團多項業務孵化、國際化探索,參與集團多輪融資主打長文本,專注迭代唯一模型:月之暗面成立于2023年3月,同年10月首次發布支持128k上下文長度的模型時處于業界領先地位,目前200萬文本長度功能內測中,僅發布唯一一款千億參數大語言模型,下階段即將發力多模態。AGI路徑戰略有一定前瞻性:多次在行業非共識階段提出公司的AGI戰略思路,如長文本是必經之路、通過ToC產品實現數據Scaling、專注迭代文本能力、在智力密集場景打造超級應用轉動數據飛輪反哺模型等觀念。信息來源:月之暗面Kimi及公開信息整理月之暗面——模型:明確主打長文本能力,專注迭代文本模型2023.03月之暗面成立2024.08正式發布企業級API2024.07Kimi開放平臺引入上下文緩存功能,加快模型響應速度2024.03Kimi智能助手200萬字上下文功能內測2023.10推出Kimi智能助手,支持

20萬字上下文輸入2024.02Kimi開放平臺公測二百萬字長文本根據月之暗面提供的信息,對于中文文本,1個Token大約相當于1.5-2個漢字,如果按1.75的比例換算,200萬字相當于114萬t

o

k

e

n

s。(Kimi智能助手200萬字上下文目前未對公眾開放,只能通過申請內測使用。)Kimi智能助手200萬字上下文功能上傳英偉達2016-2024年財報后進行長文本分析。流量領跑創業玩家,積極探索變現路徑:2023年10月推出kimi智能助手,2024年3月爆火,帶漲kimi概念股;6月網頁端點擊量超越百度文小言;2024年5月,率先上線六檔打賞功能,強調靈活性和趣味性,持續積極探索變現路徑。營銷能力突出,獲客成本高引爭議:營銷年輕化、網感好,獲客手段之一是投流,據傳CPA高達30元,雖然在業內引起爭議,但也投出了一個早期爆款應用。開始通過API建設生態,加碼B端業務:2024年2月正式面向企業和開發者開放企業級API服務,在增加B端服務的同時也開始布局產業生態。信息來源:量子位智庫、月之暗面Kimi及公開信息整理月之暗面——應用:高成本獲客打造爆款應用,網感營銷風格突出Kimi智能助手積極探索變現路徑,首發打賞制,相比傳統訂閱制度更加靈活機動,強調趣味互動,營造智能助手伙伴感。提供的高峰期不限速服務平均日價格約1.2元/天。海外競品OpenAI訂閱價格為20美元/月(約人民幣140元/月),國內競品大多為免費制。根據量子位智庫《AI智能助手APP

8月榜單》及《AI智能助手8月Web端榜單》,Kimi智能助手截至2024年8月APP端歷史總下載量近3000萬,打賞項目送Kimi一朵花位列國內第二,僅次于豆包

AI;Web

端月訪問量超

社2000

萬,位列國內第一。(完整報告請查看量子位

交智庫公眾號)

平臺網感價格

高峰期使用權限

平均每天價格

營5.2元

4天

1.30元

銷給Kimi加雞腿9.9元8天1.23元請Kimi喝咖啡28.8元23天1.25元給Kimi充充電49.9元40天1.24元請Kimi吃頓飯99元93天1.06元和Kimi一起登月399元365天1.09元信息來源:月之暗面Kimi及公開信息整理月之暗面——融資&團隊:資本寵兒,小天才范本,創業流量擔當創始團隊投資機構B+-時間 輪次 金額 估值2024

30億/05

美元訊、高榕創投2024/02B超10億美元-阿里、紅杉中國、小紅書、美團、礪思資本2023/07A--美團龍珠2023/06天使超2億美元-真格基金、紅杉中國、今日資本融資估值高、金額高、門檻高:截至2024年7月月之暗面已進行4輪融資,估值高達30億美元,融資金額均為上億美元,資方全部為頭部機構。很大程度由于創始人楊植麟在求學之路早期就開始閃耀天才星光,符合資本投人“小天才”畫像,早早吸引投資人押注,其中部分資方與楊植麟在創辦循環智能時就已結緣。創始團隊為清華計算機系四同門:主要團隊是清華計算機系本科同學。靈魂人物楊植麟標簽包括但不限于“天才學霸”、“連續創業”、“頂尖計算機學府”、“懂藝術”、“情智雙高”。周昕宇聯合創始人清華大學計算機系本科,本科曾與楊植麟共同組建樂隊Splay

Tree

在曠視科技從事算法量產工作,與曠視研究院基礎科研負責人張祥雨合作在CVPR發表ShuffleNet論文,后影響包括蘋果3D人臉解鎖在內的各種手機毫秒級人臉解鎖技術吳育昕聯合創始人

清華大學計算機系本科畢業,后到卡耐基梅隆大學深造,研究方向為計算機視覺中的檢測和識別問題,谷歌學術被引超過1.9萬次

2018年獲歐洲計算機視覺會議ECCV最佳論文提名。同年在GeekPwn國際安全極客大賽上成為唯一破解人臉識別算法的參賽團隊

曾在Meta人工智能實驗室FAIR,與隊員何愷明共同提出組歸一化GroupNormalization方法。期間還創建了Detectron2,是Meta最受歡迎的AI項目之一楊植麟創始人

高中競賽保送清華大學,大二轉去計算機系師從IEEE

Fellow唐杰,2015年以年級第一名成績畢業,本科期間曾組建搖滾樂隊Splay

Tree,任鼓手和詞曲作者

博士就讀于卡內基梅隆大學,在語言技術研究所LTI深造,師從蘋果AI研究負責人RuslanSalakhutdinov、谷歌AI首席科學家WilliamCohen。博士期間,一作身份論文引用次數破萬,頂會發表論文20余篇,和眾多學術明星如YoshuaBengio、YannLeCun、Quoc

V.Le等合著論文博二時和張宇韜創辦循環智能

博士畢業后任清華大學交叉信息研究院助理教授蟄伏一年,亮相驚艷,ScalingLaw攀登者:2023年4月階躍星辰成立,一年后首次發布Step-1千億參數語言大模型、Step-1V千億參數多模態模型和Step-2萬億參數MoE語言大模型預覽版三款大模型,團隊主要從算力、系統、數據、算法四方面為攀登Scaling

Law作準備。MoE、多模態兩手抓,邁入萬億模型俱樂部:2024年7月4日,階躍星辰在2024年世界人工智能大會上第二次亮相,發布了Step-2萬億參數MoE語言大模型正式版、Step-1.5V千億參數多模態大模型、Step-1X圖像生成大模型三款Step系列模型新款。信息來源:階躍星辰及公開信息整理階躍星辰——模型:模型矩陣能力全面,技術路徑規劃清晰算力系統數據算法通過自建機房+租用算力,積極儲備算力。成員實踐過單集群萬卡以上的系統建設與管理,訓練千億模型的有效算力輸出MFU達57%。數據團隊核心骨干來自必應搜索引擎,曾支持全球

100多種語言,為200多個國家和地區提供服務。對全球互聯網高質量語料的分布有深入了解。并建立了高質量數據處理和知識圖譜流水線。駕馭多種大模型架構,同時對大模型的認知以及發展路線進行深刻洞察。類型模型參數架構對標文本Step-2萬億MoEGPT-4多模態Step-1.5V千億-GPT-4V圖像生成Step-1X8BDiTDALL-E模型矩陣階躍星辰Step-2在VICUNA、AGIEVAL、BBH、DROP、MATH等多個國際主流Benchmark上成績超過GPT-4-1106、Claude

3和Llama

3

70BChat。主流測試集成績AGI路徑未來語言模型視覺模型聲音模型早期參數數據算力

Scale多模理解多模生成多模態大模型統一

理解及生成當前探索物理世界抽象歸納世界

超級對齊System2具身智能環境交互信息來源:躍問、冒泡鴨、階躍星辰及公開信息整理階躍星辰——應用:發力ToC,繁星計劃意圖布局應用生態ToC布局生產力和娛樂陪伴兩款產品:2024年3月首發亮相時同步發布生產力智能助手“躍問”和AI內容開放平臺應用“冒泡鴨”兩款產品,躍問目前已實現AI聯網搜索、多格式文檔解析、拍照識圖、語音輸入等功能。推出模型開放平臺,啟動繁星計劃布局生態:階躍星辰開放平臺目前已上線,2024年7月啟動繁星計劃,尋找多模態優秀初創企業、團隊和獨立開發者,提供模型、算力及其他配套支持,補充豐富自身應用生態矩陣。理解方面:目前已支持拍照識圖、語音輸入、pdf、doc/docx、excel、

csv、png、jpg等多格式文檔解析。生成方面:可以快速完成內容創作、邏輯推理、數據分析等任務。功能方面:優化了聯網搜索、文檔解析、推理速度等性能,最新推出瀏覽器插件。可實現長篇網頁、復雜文檔理解及總結可實現拍照問答、圖片理解冒泡鴨網頁端用戶在冒泡鴨上可以根據自身偏好打造智能體和劇情。冒泡鴨支持用戶自定義智能體的形象、個性、聲音、記憶、背景經歷等。目前優秀案例包括胃之書APP、野貓子工作室融資進展神秘,資方選擇審慎:成立至今未正式披露融資情況,據傳僅在2023年11月完成過一輪融資,投資方或包括紅杉中國、啟明創投、五源資本,據量子位報道,2024年6月階躍星辰正在接洽新一輪估值20億美元的新融資,阿里巴巴在投資機構名單中。研發實力突出,人才引力強,據傳背景深厚:

有深厚研發技術積淀,數據算力經驗豐富,CEO

技術強,有大團隊經驗,核心團隊聚集來自微軟、谷歌、字節、 訊、曠視等公司相關人才,成立短短一年,規模已達

150

人,先后吸引多位行業大牛加入。據傳有著名基金管理合伙人、獨角獸公司創始人、微軟華人大佬等支持。信息來源:階躍星辰及公開信息整理階躍星辰——融資&團隊:團隊聚集學術大牛,大模型相關經驗豐富朱亦博系統負責人畢業于美國加州大學圣芭芭拉分校 曾任微軟研究院研究員,曾任職字節跳動,負責公司AI基礎設施與基礎AI框架,積累了萬卡集群的搭建經驗,曾任谷歌高級主管,直接支持Anthropic段楠

天津大學博士、中國科學技術大學、西安交通大學兼職博導,天津大學兼職教授 曾任微軟亞洲研究院MSRA資深首席研究員,自然語言計算團隊研究經理,主要從事自然語言處理、多模態智能、代碼智能、機器推理等研究,多項研究成果成功應用到微軟AI產品中,擔任微軟NüWA系列模型家族項目研究組長和導師谷歌學術被引用次數逼近1.9萬,與CEO姜大昕合著過44篇論文俞剛主任研究員山東大學本科,上海交通大學計算機碩士,南洋理工大學博士

曾任訊擔任研究總監,曠視Detection組長,負責檢測、分割、跟蹤、骨架、動作行為等方面的研究以及算法落地工作,后在訊PCG光影研究室從事CV相關算法及技術研究張祥雨

西安交通大學與微軟亞洲研究院博士生聯合培養項目,師從孫劍和何愷明,博士學位

曾在微軟亞洲研究院工作,期間與何愷明、孫劍、任少卿共同完成了著名的ResNet,負責底層框架和編碼,2016獲得CVPR最佳論文獎,2023未來科學大獎“數學與計算機科學獎”,谷歌學術被引用數已超23萬

曾在曠視工作,與周昕宇共同完成移動端高效卷積神經網絡ShuffleNet姜大昕創始人、CEO

紐約布法羅州紐約州立大學計算機科學博士,南洋理工大學擔任助理教授

在機器學習、數據挖掘、自然語言處理、生物信息等領域有豐富經驗

前微軟全球副總裁、微軟亞洲互聯網工程院STCA首席科學家,在微軟期間主導多個人工智能項目,曾為Microsoft365、Azure、智能語音助手Cortana等核心產品提供關鍵技術支持焦斌星數據負責人中科大和MSRA聯合培養博士

微軟必應引擎核心搜索團隊前負責人,負責利用數據挖掘和NLP算法優化索引和搜索質量曾開發全球高質量站點的自動挖掘算法并用于索引和排序開源模型生態建設表現突出:百川智能成立于2023年4月,同年6月發布國內第一款開源模型,同年8月首批通過了生成式人工智能備案,是名單中最年輕的公司;百川大模型支持LLAMA熱插拔,兼容及可拓展性好,開源后下載量領先,累計下載超700萬次。搜索引擎技術基因,先天優勢:自2023年4月10日成立以來,持續迭代基座大模型,最新一代基座超千億參數大模型Baichuan4在SuperCLUE評測中處于國內大模型第一梯隊,在知識百科、長文本、生成創作等文科類中文任務方面,表現優于國外大模型。信息來源:百川智能、hugging

face及公開信息整理百川智能——模型:開源生態突出,模型矩陣全面2023.04百川智能成立2024.01發布超千億參數大語言模型Baichuan

32023.09發布Baichuan2大模型,開放API接口2023.08發布530億參數模型,同步啟動千億參數模型訓練2024.05發布Baichuan

4,并推出智能助手應用百小應2024.07聯合天津大學推出

Sibyl

System

Agent框架,GAIA排名第一2023.06推出70億參數大模型Baichuan-7B2023.07推出130億參數大模型Baichuan-13BBaichuan開源模型huggingface

8月月下載量百川智能Baichuan2系列開源模型在開放社區公開累計下載量已經突破700萬次,最新hugging

face月下載量超6萬次。開源模型下載量百川智能Baichuan4在MMMU、MMBench-EN、CMMMU等多個國際主流Benchmark上成績接近GPT4V。ToC布局生產力應用,發力AI生命醫療方向:百川智能于2024年5月發布了ToC生產力助手百小應,主打多輪搜索能力。另外,還在2024WAIC上發布了AI健康顧問應用,具備豐富醫學知識,高度擬人,可連續交互并給出診斷建議,百川智能計劃在2025年實現L3級別AI醫療。ToB以MaaS平臺為業務重心:百川智能在ToB方向推出MaaS(Model

as

a

service)+AaaS(Agent

as

a

service)服務,Maas為重心,分旗艦版和專業版,

AaaS服務已開啟公測,API調用能力接近OpenAI。信息來源:百川智能、蝶境內測及公開信息整理百川智能——應用:ToC上線生產力應用,發力AI生命醫療等級L5完全自動化健康管理L4高度自動化診療L3條件自動化診療L2多模態輔助L1輔助診斷L0傳統醫療百川智能劃分AI醫療水平AI能夠管理患者的整個健康旅程,從預防、診斷到治療,無需人工干預AI可以在大多數常見疾病中獨立做出診斷和治療決策,僅復雜案例需要醫生介入AI可以在特定條件下自動推薦治療方案,但在關鍵決策時需要醫生確認AI可以整合多種數據源(如病歷、影像、實驗室結果),提供更全面的輔助信息AI可以提供數據分析活圖像識別等單一功能的輔助,幫助醫生做出更好的決策醫生負責所有的診斷和治療決策,沒有AI介入百川智能計劃在2025

年實現L3

級別AI醫療發力AI醫療ToB業務ToB

云服務AI法律AI教育AI醫療AI供應鏈百小應主打多輪搜索功能,相比單輪搜索,在市場調研、產業分析等復雜場景下,能更有效地獲取專業深度信息,搜索結果可結構化呈現,還能實現網頁鏈接、P

D

F、

word文檔長文理解分析。百小應APP端頁面訊投資、小米集團等已完成A輪融資,金額大、估值高:截至2024年7月,百川智能已完成A輪融資,7月最新一輪融資規模50億人民幣,資方包括阿里巴巴、機構以及北京市人工智能產業投資基金、上海人工智能產業投資基金、深創投等國資基金。目前已經以200億估值開啟B輪融資。王小川帶隊,攜搜狗核心班底再創業:作為搜狗前任CEO,王小川是大模型創業六小強中唯一具備創業并上市經歷的創始人,他帶領搜狗核心班底創立百川智能,團隊技術實力不容小覷,由強系統性工程經驗人才,語言模型認知優勢的研發人員兩部分組成。信息來源:百川智能及公開信息整理百川智能——融資&團隊:A輪融資已完成,搜狗核心班底再創業團隊成員時間 輪次金額估值投資機構三七互娛、中金資本、亞投資本、信雅達、卓源亞洲、好未來、小米集團、慕華資本、深創投、紅點中2024.07A50億人民幣-國、訊投資、阿里巴巴、順為資本、上海人工智能產業股權投資基

金合伙企業、臨港科創投、北京市人工智能產業投資基金、順禧基金、中貝通信集團股份有限公司2023.10A3.5億美元19億美元阿里巴巴、訊投資、小米集團、心資本、愉悅資本、金山軟件、順為資本、好未來、清華控股、深創投、紅點中國、慕華科創、淡策資本、卓源亞洲、眾為資本2023.04天使輪5000萬-王小川王小川創始人、CEO清華大學計算機科學與技術專業,擁有工學學士、工學碩士、工程博士及EMBA學位與清華大學共建天工智能計算研究院,任聯席院長曾任搜狗公司CEO、董事、搜狐高級副總裁兼CTO,帶領搜狗在美國紐交所上市焦可聯合創始人、產品負責人清華大學計算機系本科,中科院計算所碩士曾任智融集團創始人兼CEO、百度高級產品經理茹立云聯合創始人、運營負責人清華大學計算機系博士,浙江省高考狀元,清華大學天工智能研究院副院長曾任搜狗公司COO,負責運營及搜索事業部,人工智能教育公司葡萄智學創始人兼CEO洪濤聯合創始人、商業負責人清華大學電子工程系本科,長江商學院EMBA曾任搜狗科技CMO、訊PCG商業化GM信息來源:零一萬物、零一萬物大模型開放平臺及公開信息整理零一萬物——模型:AI

Infra技術領先,模型開閉源并重開源模型矩陣Yi-1.5系列模型大幅提高了數學邏輯及代碼能力,在多個國際中英文主流數據集中表現優于同量級模型。零一萬物最新閉源模型Yi-Large在

HumanEv

al、MATH、MT-Bench等數據集上,成

績超越

GPT-4。2023.05零一萬物成立2024.06Yi-Large系列大模型正式登陸阿里云百煉平臺2024.01發布開源多模態語言大模型Yi-VL2024.03發布開源Yi-9B大模型,并發布Yi大模型API開放平臺2023.07李開復官宣零一萬物,官網同步上線2023.11發布首款340億參數預訓練大模型Yi-34B2024.05發布千億參數閉源大模型Yi-

Large,升級開源系列模型2024.09發布系列開源模型

Yi-Coder,支持52種主要編程語言Yi-1.5-9B

&

6B

chat模型在多個國際主流測試集成績Yi-Large千億參數基座模型Yi-Large-RAG

RAG檢索增強Yi-Large-Turbo高性能高性價比Yi-Medium中型尺寸升級微調Yi-Medium-200K超長文本窗口Yi-Spark小型精悍輕量極速閉源模型矩陣Yi-Large多項國際SOTA成績領先AIInfra技術節約訓練成本:構建數千卡GPU集群進行訓練、調優和推理,提高數據有效參數量,以及使用的高質量數據的密度,以構建連續、可控、科學化的訓練能力。目前,零一萬物具備全棧Al

lnfra能力,在國內率先端到端實現全球先進FP8訓練框架。模型取得國際SOTA,閉源開源并重:2023年11月首次發布Yi系列大模型,涵蓋閉源和開源。2024年5月閉源模型Yi-Large在測試集LMSYS中成績位列國產第一,以千億參數尺寸追齊硅谷巨頭萬億模型。開源矩陣目前已經推出多模態模型、代碼模型及通用模型等。零一萬物致力于通過自主創新架構加速追趕OpenAI。Yi-1.5-6B/9B/34B開源基座模型Yi-VL-6B/34B多輪文本/圖像對話Yi-1.5-6B/9B/34B-Chat消費級顯卡可部署Yi-Coder-1.5B/9B

開源代碼大語言模型大腦長短記憶智能對話知識庫多語言形象形象復制口型對齊表情生成動作訓練聲音多國語言高度還原情感表達風格遷移數字人基礎大模型多模態底座電商話術大模型角色大模型直播聲音大模型語言模型視覺理解文生圖聲音模型文生視頻多模態協同訓練AI伴侶IP形象本地\電商直播辦公會議媒體營銷應用場景信息來源:零一萬物及公開信息整理數字人解決方案零一萬物——應用:BG端多種解決方案,探索Make

AI

Work電商數字人解決方案部署快、成本低:解決方案圍繞品牌連鎖,主打極簡直播和短視頻解決方案,通過構建專屬電商語言和聲音大模型,實現高質量話術和互動內容。全行業ToB解決方案“一橫一縱”打法:ToB模型解決方案發揮基座模型橫向泛化能力,輔以SFT監督學習能力縱向做深做透各行業,提供標準化、垂直精細化全行業ToB整體解決方案,目前落地零售、醫療、教育等領域,涉及AI搜索、AI生產力工具、AI智能巡檢等場景。AI

Infra賦能BG端客戶:面向BG端客戶協助政企搭建大模型算力與服務平臺設施,加速大模型低成本端到端落地,賦能企業群體、政務服務。全行業ToB解決方案ToB合作伙伴AI翻譯智能巡檢

AI字段捷徑AI智能助手落地場景創始團隊信息來源:零一萬物及公開信息整理零一萬物——融資&團隊:半年就成獨角獸,李開復親自帶隊時間 輪次 金額估值 投資機構2024/08-數億美元-某國際戰投東南亞財團超10億美元阿里云2023/11天使-2023/05天使--創新工場創新工場孵化,阿里云等多家頭部機構押注:作為創新工場塔尖孵化的第七家公司,零一萬物可謂“含著金湯匙出生”,估值狂奔半年就成獨角獸。2024年8月,據媒體報道,零一萬物已獲新一輪數億美元融資,融資參與方包括某國際戰投、東南亞財團等多家機構。七大技術模塊招攬頂尖人才領頭:零一萬物將研發拆解為七大模塊技術路線圖,各模塊均招募頂級科學家和工程師,集合全球最先進的大模型技術認知和論文實踐,搭建國際化人才團隊。李開復創始人

CEO卡內基梅隆大學計算機博士曾任谷歌全球副總裁兼大中華區總裁曾任微軟公司副總裁,創立微軟亞洲研究院曾任蘋果公司副總裁戴宗?聯合創始人曾任華為云AI

CTO、華為云技術創新部部長阿里巴巴達摩院前AI

Infra總監

曾領導多家主體AI

infra部門,支持中國三大100B+大型LLM模型訓練祁瑞峰聯合創始人曾為Aibee聯合創始人曾任美菜網高級副總裁 曾任史賓沙SpencerStuart大中華區科技互聯網行業負責人曾任甲骨文、微軟和SAP前業務高管馬杰聯合創始人曾任百度安全、IT和元宇宙副總裁 曾為基于SaaS的云安全初創公司“安全寶”創始人兼CEO,后被百度收購曾任瑞星殺毒軟件研發主管創業六小強共同點:轉動關鍵飛輪融資優勢支撐模型持續迭代模型開發能力是融資決策核心要素強大模型能力提升應用使用體驗海量真實應用數據反哺模型迭代充足糧草助力應用更快落地增長商業化探索提升資本增值想象空間創業六小強AGI生態位月之暗面智譜AI階躍星辰M百iniMax川智能零一萬物市場估值綜合實力AGI生態位微信公眾號:零豎質量DeepSeek:insights微信公眾號:零豎質量信息來源:DeepSeek、暗涌采訪及公開信息整理DeepSeek——模型:自研SOTA開源MoE,海外技術傳播效果好脫胎于量化私募機構,自帶萬卡:DeepSeek深度求索脫胎于國內知名量化私募機構——幻方量化,幻方量化以人工智能技術進行量化投資而聞名,早年儲備萬卡算力,不僅如此,幻方量化可為深度求索提供每年幾億的資金支持,在算力和財力上都為深度求索的誕生打下獨特基礎。架構創新,模型開源:DeepSeek堅持進行零到一前沿架構創新和模型開源戰略,據創始人表示這源于公司的理想主義基因和技術普惠信仰。開源模型矩陣在DeepSeek內部中文評測中,DeepSeek-V2.5和GPT-4omini、ChatGPT-4o-latest的對戰勝率(裁判為GPT-4o)相較于DeepSeek-V2-0628均有明顯提升。2015幻方量化成立2024.06深度求索發布

DeepSeek-VL多模態大模型2023.07深度求索成立2021幻方AI投入10億建設"螢火二號"2019幻方量化資金規模超

100億,成立幻方AI2020幻方AI投入2億建設的千卡"螢火一號"超級計算機正式運行2022.11深度求索發布開源代碼大模型DeepSeekCoder2024.05深度求索開源國內首個MoE大模型

DeepSeekMoE2024.05深度求索發布

DeepSeek-V2模型,模型降價引發價格戰架構創新類型模型參數架構通用基座+代碼DeepSeek-V2.5-MoEMoEDeepSeek-MoE8B/16BMoE多模態DeepSeek-VL7B/1.3B混合視覺編碼器數學推理DeepSeek-Math7BMoE數學定理證明DeepSeek-Prover7BMoE“DeepSeek

V2論文‘可能是今年最好的一篇’。”——SemiAnalysis首席分析師“DeepSeek論文充滿驚人智慧。”——OpenAI前員工Andrew

Carr“這種強烈的反響源自架構層面的創新,是國產大模型公司乃至全球開源基座大模型都很罕見的嘗試。”——多位行業人士表示LMSYS大模型競技場結果信息來源:DeepSeek及公開信息整理DeepSeek——應用:價格戰始作俑者,代碼生成能力受關注大廠之外罕見萬卡持有者,打響大模型價格戰:值得注意的是,DeepSeek的降價不靠燒錢靠模型性能,2024年5月,DeepSeek發布開源模型DeepSeekV2采用先進

MoE

稀疏架構將模型

API

調用成本降至

1

元/百萬

tokens,

隨后字節、 訊、百度、阿里等大廠紛紛跟進,打響國產大模型價格戰。不過早做應用,代碼生成能力引起關注:DeepSeek目前僅發布網頁端DeepSeekV2.5通用對話助手、DeepSeekV2.5代碼助手面向公眾開放模型能力免費使用,不急于發布ToC產品,追求引領技術前沿,希望與應用創業者共創生態。目前網頁端助手的代碼能力在行業內引起討論受到關注。2

0

2

4年5月,DeepSeek發布V2開源模型,先進架構大幅降低API成本至僅1元/百萬tokens,是當時GPT-4Turbo的七十分之一。隨后字節、

訊、百度、阿里等大廠也紛紛降價,中國大模型價格戰由此觸發,DeepSeek也因此被冠以“AI界拼多多”稱號。DeepSeek

5月發布的彼時各大模型API價格對比DeepSeek同名網頁端主要作為免費調用模型能力的公開入口存在,沒有推出APP和小程序,也沒有AI智能助手類產品的很多優化。通用對話和代碼助手兩個功能分別對應DeepSeek的通用模型DeepSeek-V2.5和代碼模型DeepSeek-Coder-V2.5,通用模型的數學能力和代碼模型的編程能力在用戶中被討論和使用較多。DeepSeek同名應用網頁端界面信息來源:DeepSeek、暗涌采訪及公開信息整理DeepSeek——團隊:量化私募出身,團隊秘而不宣脫胎于幻方量化,團隊保持神秘:DeepSeek-V2模型發布后行業內對于其研發團隊構成有諸多猜測,從歷史來看,DeepSeek脫胎于幻方量化,或繼承其人才基因,而成立后新吸納人才中據稱既沒有硅谷海歸也沒有高管大佬,而是以本土應屆和畢業一兩年“沒有經驗但有潛能”的年輕人才為主,具體人員名單仍保持神秘。組織架構或利好創新:ChatGPT沒有發生在巨頭公司,而是誕生于OpenAI,這讓很多人相信AI時代的創新需要全新的組織架構,DeepSeek既不同于大廠也不同于純除初創公司的組織架構也許有利于創新。據創始人梁文鋒表示,“在公司內部,每位員工都可以調動算力和人力,無需審批,同時因為不存在層級和跨部門,員工也可以靈活調用所有人,只要對方也有興趣。”權限自由據創始人梁文鋒表示,不同于很多模型公司高薪招聘海外及巨頭公司大模型人才,“V2模型的研發團隊沒有海歸,都是本土青年人才,目前A

I前5

0名頂尖人才也許不在中國,但

DeepSeek或許可以靠自己打造這樣的人才”。不拘履歷據創始人梁文鋒表示,“DeepSeek全是自下而上。一般不前置分工,而是自然分工。相信每個員工自帶想法,無需push。探索過程中遇到問題,自己會拉人討論。當一個idea顯示出潛力時,也會自上而下地調配資源。”松散管理梁文鋒創始人

CEO浙江大學本科、碩士,人工智能專業

創立幻方量化,2016年首次上線運行AI策略,到2017年底時,投資策略全面AI化,2019年資金規模破百億,2021年破千億,后穩居國內量化私募“四巨頭”創始人幻方量化投資團隊奧林匹克數學、物理、信息學金銀牌得主ACM金牌得主AI領域大牛和領軍人物

拓撲學、統計學、運籌學、控制論等學科博士幻方量化人才畫像深度求索人才畫像深度求索模型團隊本土Top高校應屆畢業生博士實習生DeepSeek,

..,....insights微信公眾號:零豎質量信息來源:面壁智能及公開信息整理面壁智能2024年8月發布最新小鋼炮系列模型

M

i

n

i

C

P

M-V2.6,僅8B參數,取得20B以下單圖、多圖、視頻理解3

SOTA成績,將端側AI多模態能力拉升至GPT-4V水平。最新端側開源模型性能2018面壁智能脫胎于清華大學

NLP實驗室,發布全球首個知識指導的預訓練模型ERNIE2022面壁智能成立,發布生物醫學領域大模型KV-PLM及可控生成大模型CPM-32021與北京智源人工智能研究院聯合成立“語言大

模型加速技術創新中心”2020面壁智能成為悟道大模型的首發主力陣容2023.01面壁智能發布百億參數多語言大模型CPM-Bee登頂ZeroCLUE2024.05面壁智能發布千億參數多模態大模型CPM-

Cricket,對標GPT-3.52023.04面壁智能發布BMTools開源工具學習平臺,完成數千萬元的天使輪融資2024.08面壁智能發布8B參數多模態端側模型MiniCPM-V2.6,對標GPT-4VMiniCPM-V26多模態性能對比創始人回應抄襲事件面壁智能——模型&應用:大模型端側落地先鋒,性能四兩撥千斤端側“小鋼炮”性能領先,端云協同探索者:2024年蘋果開發者大會后端側模型概念進入主流視野,國外OpenAI和蘋果等廠商紛紛發布端側模型,面壁智能在國內很早聚焦端側,最新開源模型性能達國際水平,探索端云大小模型協同推理技術,實現模型精細化“降本增效”,在AI端側設備可預見普及后,端側模型前景樂觀。被斯坦福團隊抄襲,意外走紅國際:2024年6月,三位美國斯坦福大學學生團隊承認開源模型Llama3-V抄襲面壁智能開源模型MiniCPM-Llama3-V

2.5,兩者擁有幾乎完全相同的模型架構與代碼,面壁智能因此意外在國際走紅。面壁智能CEO李大海在朋友圈回應抄襲事件信息來源:面壁智能及公開信息整理面壁智能——融資&團隊:脫胎清華,知乎布局,華為投資清華+知乎研發團隊:面壁智能名稱來源于著名科幻小說“三體”,團隊脫胎于清華大學NLP實驗室,聚集杰青、歐洲科學院外籍院士、谷歌前員工、智譜AI團隊前成員等行業優秀人才,CEO李大海為知乎合伙人、CTO。已進行天使輪及A輪兩輪融資:早期天使輪獲知乎及智譜AI投資,A輪知乎加注,春華創投、華為哈勃、北京人工智能產業投資基金是新加資方。融資情況時間輪次 金額 估值投資機構2024/04

A輪-春華創投、華為數億哈勃、北京市人元工智能產業投資基金、知乎2023/04天使輪-數億元知乎、智譜華章劉知遠聯創首席科學家

清華大學清華大學計算機系副教授,清華自然語言處理與社會人文計算實驗室THUNLP成員,清華人工智能研究院基礎模型研究中心副主任,智源青年科學家

研究方向自然語言處理、知識圖譜和社會計算,在著名期刊和會議發表論文200余篇,谷歌學術被引用超3.1萬次曾獲教育部自然科學一等獎,入選國家青年人才計劃,《麻省理工科技評論》中國區35歲以下科技創新35人李大海創始人

CEO北京大學數學系碩士

曾為谷歌中國創始員工,云云網工程總監,豌豆莢搜索技術負責人,是連續12年創業者

曾任知乎合伙人、CTO,負責整體技術體系搭建,分管社區治理和用戶體驗中心,從零開始為知乎搭建搜索和推薦業務,知乎AI智能社區發起人,幫助知乎實現從百萬到億級的跨越研究方向人工智能和大模型應用曾國洋CTO 8歲開始學習編程,高中競賽金牌保送到清華大學,大二加入清華NLP實驗室,師從劉知遠高三曾在曠視實習,開始接觸AI領域

曾為智源悟道·文源中文預訓練模型團隊骨干成員,研究方向計算機視覺和深度學習

作為聯合發起人創建OpenBMB開源社區,是模型訓練加速和推理加速BMTrain、BMInf的主要作者之一國內巨頭玩家格局總覽信息來源:百度、百度2024

Q2財報及公開信息整理百度:國產AI第一重鎮,中文大模型頭號玩家文心大模型矩陣業務架構智能云依據IDC報告,2023年百度智能云在中國AI公有云服務市場份額第一昆侖芯高速互聯、AI服務器、

GPU虛擬化、彈性訓練飛槳底座平臺數據標注、部署運行、模型開發、知識生產文心大模型行業、應用、社區智慧能源、智能制造、智慧金融、智慧城市、文小言、文心一格、

旸谷社區行業大模型、NLP大模型、視覺大模型、跨模態大模型、生物計算大模型截至2024Q2

文心大模型:日均模型調用量日均處理tokens6

億+ 1

萬億+行業大模型浦發·百度文心航天·百度文心國網·百度文心深燃·百度文心吉利·百度文心泰康·百度文心TCL·百度文心電影頻道·百度文心冰城·百度文心視覺大模型OCR圖像表征學習

VIMER-StructTexT多任務視覺表征學習VIMER-UFO視覺處理多任務學習VIMER-TCIR自監督視覺表征學習VIMER-CAE跨模態大模型文檔智能ERNIE-Layout文圖生成

ERNIE-ViLG視覺·語言

ERNIE-ViL視覺·語言

ERNIE-SAT生物計算大模型化合物表征學習HelixGEM蛋白質結構預測HelixFold單序列蛋白質結構預測HelixFold-Single文心一言ERNIEBot對話PLATO跨語言ERNIE-M搜索ERNIE-Search代碼ERNIE-CodeNLP大模型語言理解與生成ERNIEERNIE3.0ERNIE3.5鵬城-百度·文心ERNIE4.02024發布文心大模型4.0工具版及4.0

Turbo起步最早,布局完整,模型全面:百度是國內互聯網大廠中最早布局大模型的玩家之一,截至2024年,百度已建立百度大腦及百度智能云千帆大模型平臺,推出了

ERNIE、VIMER等系列模型并布局文小言、文心一格等基于大模型能力的AI應用。2024年Q2大模型落地成績亮眼:據百度財報顯示,截至2024年Q2,文心大模型日調用量超6億次,近半年來增長10倍,文心大模型日均tokens使用量超1萬億,飛槳文心社區開發者數量已達1465萬。公開數據顯示,百度智能云千帆大模型平臺已累計服務15萬客戶,幫助用戶累計精調2.1萬個大模型。2023發布AI應用文心一言(現文小言)及多模態大模型和百度智能云千帆大模型平臺2019發布文心大模型1.0及2.02016發布百度大腦及深度學習框架飛槳PaddlePaddle2021發布知識增強百億參數文心大模型3.02023發布文心大模型4.0名稱行業功能定位通義聽悟語音識別生產力助手,提供工作學習語音轉寫通義曉蜜智能客服為企業提供更高效的客服解決方案通義智文文本理解幫助用戶高效地閱讀并理解各類文本通義靈碼代碼編程為開發者提供代碼生成、補全等功能通義萬相圖片生成實現圖像、視頻等多模態理解生成通義星塵角色扮演實現娛樂社交場景的個性化虛擬角色創建通義法睿法律服務提供法律咨詢、合同審查等服務通義仁心醫療服務為用戶提供健康管理、疾病預防建議通義點金金融服務為金融行業提供投資研究、風險分析服務信息來源:阿里巴巴及公開信息整理阿里巴巴:投資與自研并舉,開源模型代表,借助云優勢推進MaaS投資與自研并舉,堅持開源:在自研大模型的巨頭玩家中,阿里是投資最多創業“同行”的一家,截至2024年9月,阿里已經投資大模型創業六小強中的五家,據消息阿里對最后一家亦有投資意向。另外,阿里也是大廠里代表性的模型開源玩家,通義千問系列開源模型在全球深受開發者群體歡迎,總下載量已突破2000萬次。

MaaS布局早,服務全面:阿里云早在2022年開始布局MaaS業務,并搭建了一套以AI模型為核心的云計算技術和服務架構,積累了豐富的大模型研發經驗、工具和平臺,這套能力全部向大模型初創企業和開發者開放,提供包括模型訓練、推理、部署、精調、測評、產品化落地等的全方位服務。2020啟動中文多模態預訓練模型M6項目,同年推出3億參數基礎模型2022發布通義系列大模型,推動AI向通用智能進化2021.05發布萬億參數模型并投入使用,可實現文生圖2021.01發布十億參數規模模型2023.04發布通義千問大模型,可實現多輪多語言對話、多模理解、邏輯推理2024.05發布通義千問最新2.5版本2023.10發布千億參數通義千問2.0大模型,及8大行業模型和應用開發平臺阿里云百煉等底座高質量數據集領先算法框架豐富行業知識與生態大模型矩陣通義千問通義千問-Turbo通義千問-Plus通義千問-Max通義千問-Long通義千問-VL-Plus通義千問-VL-Max通義千問開源Qwen2.5Qwen2-mathQwen1.5QwenQwen-1.8B-長文本Qwen-1.8BQwen-VL-V1Qwen-VL-Chat-V1ModelScope模搭社區LlamaIndexHugging

Face三方及行業大模型開發者社區Llama大語言模型Llama3-8B百川開源大語言模型ChatGLM開源大語言模型Llama3-70BLlama3-7BStableDiffusion文生圖模型Llama2-13B微信公眾號:零豎質量信息來源:騰訊及公開信息整理訊:全鏈路自研大模型,ToC應用背靠微信,ToB落地內外并行全鏈路自研,模型訓練緊跟前沿: 訊選擇了一條基于自主體系的全鏈路自研道路,從零開始啟動預訓練,從

AI

基礎設施到機器學習框架,再到模型算法實現全鏈路閉環。2023

9

月, 訊發布超千億參數混元大模型,是行業內較早采用

MoE

DiT

等先進架構的大模型。ToC背靠微信,ToB對內賦能對外開放:ToC

應用元寶基于混元大模型能力,最大特色是深度整合微信生態資源,特別是微信公眾號這一內容平臺。而在

ToB

方面,混元大模型目前已成功應用于廣告、搜索和對話等50多個 訊內部業務和產品,并已通過 訊云服務對外開放,助力全行業多種應用場景。元寶AI聊

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論