凸顯底層創(chuàng)新能力,這家量化私募向NIPS投遞大模型研究論文
摘要: 近日,國(guó)內(nèi)量化私募念空科技向國(guó)際頂會(huì)NIPS(NeuralInformationProcessingSystems,神經(jīng)信息處理系統(tǒng)大會(huì))投遞了與上海交大計(jì)算機(jī)學(xué)院合作的大模型研究論文。
近日,國(guó)內(nèi)量化私募念空科技向國(guó)際頂會(huì)NIPS(Neural Information Processing Systems,神經(jīng)信息處理系統(tǒng)大會(huì))投遞了與上海交大計(jì)算機(jī)學(xué)院合作的大模型研究論文。5月20日,該投遞論文網(wǎng)址鏈接公布。
業(yè)內(nèi)人士認(rèn)為,此舉顯示了中國(guó)金融科技不止于應(yīng)用落地,還具備一定的底層創(chuàng)新能力。
在同等訓(xùn)練量下,幫助大模型變得更聰明
資料顯示,成立于2015年的念空科技,是市場(chǎng)上較早將人工智能(AI)應(yīng)用于金融領(lǐng)域的量化私募,其機(jī)器學(xué)習(xí)應(yīng)用覆蓋期貨、股票等。2019年,公司幾乎全部轉(zhuǎn)向神經(jīng)網(wǎng)絡(luò)算法,2020年起,公司在此基礎(chǔ)上搭建全流程投研平臺(tái),次年管理規(guī)模突破百億元。
2023年,OpenAI的ChatGPT橫空出世。在念空科技創(chuàng)始人王嘯看來(lái),大模型的出現(xiàn)為量化行業(yè)提供了一個(gè)全新的算法工具,但ChatGPT使用成本較高、使用權(quán)限較低,很難進(jìn)行大規(guī)模訓(xùn)練。

今年,DeepSeek因其開源的特征打破多種限制,實(shí)現(xiàn)“智能平權(quán)”,同時(shí)讓世人看到強(qiáng)化學(xué)習(xí)對(duì)大模型的推理能力至關(guān)重要。
念空科技所遞交的念空大模型論文的突破性成果在于,從人類的學(xué)習(xí)方法的經(jīng)驗(yàn)得到啟發(fā),如果高頻的在少量刷題和小測(cè)試經(jīng)驗(yàn)總結(jié)之間切換,可能更有利于學(xué)習(xí)成績(jī)(推理能力)的提高,設(shè)計(jì)了一種step by step切換監(jiān)督微調(diào)(sft)和強(qiáng)化學(xué)習(xí)(rl)的訓(xùn)練方法。
最終實(shí)驗(yàn)發(fā)現(xiàn),在三個(gè)不同的公開數(shù)據(jù)集上,念空科技提出的新的訓(xùn)練框架明顯優(yōu)于單獨(dú)的sft、單獨(dú)的rl以及簡(jiǎn)單混合sft和rl,證明提出的新的框架是當(dāng)下更優(yōu)的后訓(xùn)練方式。通俗的說(shuō),念空的研究成果可以幫助大模型在同等訓(xùn)練量下變得更聰明。
設(shè)立全資公司探索AI技術(shù)邊界
與一般的金融機(jī)構(gòu)招聘不同,量化投資的門檻往往較高,通常是數(shù)學(xué)、統(tǒng)計(jì)學(xué)、金融學(xué)、計(jì)算機(jī)技術(shù)的結(jié)合,通過(guò)挖掘海量數(shù)據(jù)(603138),尋找規(guī)律,做出預(yù)測(cè),并使用這個(gè)規(guī)律進(jìn)行自動(dòng)的計(jì)算和決策,需要克服人性弱點(diǎn)。
據(jù)了解,對(duì)于核心人才的選擇,念空科技更愿意從零開始培養(yǎng),公司團(tuán)隊(duì)70%—80%的AI工程師都是從高校實(shí)習(xí)生或是應(yīng)屆生招進(jìn)來(lái),在幾個(gè)月的時(shí)間里,他們會(huì)使用公司的體系、規(guī)則,公司逐步就能判斷這個(gè)人是否適合念空科技。
值得一提的是,為了具體問(wèn)題的技術(shù)研究和模型優(yōu)化,王嘯在2025年成立了上海全頻思維人工智能科技有限公司(AllMind),專注于研究通用大語(yǔ)言模型(LLM)相關(guān)底層算法和工程技術(shù)。
據(jù)介紹,AllMind著眼于大模型的基礎(chǔ)學(xué)術(shù)研究和應(yīng)用,短期內(nèi)并不以盈利為目的。與念空科技主攻金融垂直場(chǎng)景不同,AllMind的定位為高質(zhì)量CoT數(shù)據(jù)生產(chǎn)方向的學(xué)術(shù)探索,主要研究方向?yàn)榇竽P偷讓蛹夹g(shù)研究和不限于金融場(chǎng)景的垂直應(yīng)用。
模型








临澧县|
长子县|
新邵县|
建德市|
库尔勒市|
犍为县|
临桂县|
河池市|
荥经县|
SHOW|
略阳县|
辉南县|
寿阳县|
锡林浩特市|
黄梅县|
攀枝花市|
涞水县|
城口县|
从江县|
瓦房店市|
宣城市|
万载县|
翼城县|
天气|
赫章县|
宁阳县|
道孚县|
岳普湖县|
鹤山市|
会同县|
珠海市|
珲春市|
永昌县|
庆安县|
崇左市|
山丹县|
资溪县|
江都市|
台北市|
堆龙德庆县|
措勤县|