巖山科技:巖思類腦研究院的腦電大模型目前尚處于研究階段,尚未產(chǎn)生營業(yè)收入
摘要: 消息,巖山科技(002195)03月10日在投資者關(guān)系平臺(tái)上答復(fù)投資者關(guān)心的問題。投資者:請(qǐng)介紹一下收購智駕最新進(jìn)展情況和智駕公司目前技術(shù)開發(fā)及業(yè)務(wù)訂單及完成的最新情況?謝謝!巖山科技董秘:您好,
消息,巖山科技(002195)03月10日在投資者關(guān)系平臺(tái)上答復(fù)投資者關(guān)心的問題。
投資者:請(qǐng)介紹一下收購智駕最新進(jìn)展情況和智駕公司目前技術(shù)開發(fā)及業(yè)務(wù)訂單及完成的最新情況?謝謝!
巖山科技董秘:您好,感謝對(duì)公司的關(guān)注。公司擬控股企業(yè)Nullmax (Cayman) Limited主要從事汽車智能駕駛系統(tǒng)的研發(fā),致力于打造全場景的無人駕駛應(yīng)用。Nullmax紐勱作為一家專注于智能駕駛技術(shù)的科技公司,擁有豐富的技術(shù)經(jīng)驗(yàn)和專業(yè)知識(shí),其在計(jì)算機(jī)視覺、機(jī)器學(xué)習(xí)、感知技術(shù)、智能駕駛工程化等領(lǐng)域取得了顯著的成就。Nullmax已有的項(xiàng)目落地客戶包括上汽、奇瑞、經(jīng)緯恒潤、德賽西威等,與頭部車企合作推進(jìn)順利,同時(shí)正在推進(jìn)軟硬件一體化項(xiàng)目,為未來取得更多量產(chǎn)定點(diǎn)合同提供有力保障。公司擬增資并收購Nullmax (Cayman) Limited部分股權(quán)的事項(xiàng)目前正在向商委、外匯管理局等主管部門辦理境外投資ODI審批手續(xù),相關(guān)項(xiàng)目的進(jìn)展請(qǐng)以公司公告為準(zhǔn)。謝謝。
投資者:非常高興獲悉中國獨(dú)具創(chuàng)新的Yan大模型!該模型何時(shí)能夠提供公測(cè)?現(xiàn)在大模型的accuracy(準(zhǔn)確度)數(shù)據(jù)如何?Yan2.0何時(shí)推出?謝謝!
巖山科技董秘:您好,感謝對(duì)公司的關(guān)注。Yan 1.0模型尚未完成大模型備案,目前主要嘗試針對(duì)B端客戶進(jìn)行本地私有化部署,暫時(shí)無法提供公測(cè),敬請(qǐng)諒解。我們對(duì)相同參數(shù)量級(jí)的Yan 1.0模型和基于Transformer(對(duì)照實(shí)驗(yàn)中采用的Transformer是基于HuggingFace LLaMA 2的標(biāo)準(zhǔn)結(jié)構(gòu),同時(shí)開啟了flash-attn的支持)架構(gòu)模型分別用1,000萬條中英平行語料,基于同樣軟硬件環(huán)境的NVIDIA A800服務(wù)器訓(xùn)練3個(gè)Epoch,從訓(xùn)練結(jié)果來看,在對(duì)照實(shí)驗(yàn)環(huán)境下Yan 1.0模型比Transformer架構(gòu)的LLaMA 2模型在訓(xùn)練集(即模型學(xué)習(xí)過的數(shù)據(jù))上的預(yù)測(cè)準(zhǔn)確率高出17%、在驗(yàn)證集(即模型未學(xué)習(xí)過的數(shù)據(jù))上的預(yù)測(cè)準(zhǔn)確率高出13%。巖芯數(shù)智團(tuán)隊(duì)目前正在研發(fā)Yan 2.0模型,Yan 2.0模型將會(huì)融合文字、音頻、視頻等多模態(tài),以應(yīng)用于更廣泛的業(yè)務(wù)。Yan 2.0模型預(yù)計(jì)將于2024年下半年推出,具體推出時(shí)間請(qǐng)以后續(xù)巖芯數(shù)智的發(fā)布為準(zhǔn)。公司提醒投資者警惕市場熱點(diǎn)炒作,理性投資并注意投資風(fēng)險(xiǎn)。謝謝。
投資者:董秘您好!請(qǐng)介紹一下公司子公司的Yan模型1.1在訓(xùn)練效率、推理、記憶能力、算力消耗、顯存占用及成本方面的情況如何? 正在研究的Yan1.2具體有哪些枝術(shù)特點(diǎn)?目前研究的進(jìn)度如何?預(yù)計(jì)何時(shí)能發(fā)布?謝謝啦!
巖山科技董秘:您好,感謝對(duì)公司的關(guān)注。巖芯數(shù)智于2024年1月發(fā)布了Yan 1.0模型,計(jì)算復(fù)雜度從標(biāo)準(zhǔn)Attention機(jī)制的O(n^2?d)(其中n表示序列長度、d表示特征維度,^2指平方)降低為O(n?d)(線性復(fù)雜度),從而提高模型的訓(xùn)練效率和收斂速度,因此Yan 1.0模型產(chǎn)生的資源消耗更低,更加經(jīng)濟(jì)、更加低碳。我們對(duì)相同參數(shù)量級(jí)的Yan 1.0模型和Transformer(對(duì)照實(shí)驗(yàn)中采用的Transformer是基于HuggingFace LLaMA 2的標(biāo)準(zhǔn)結(jié)構(gòu),同時(shí)開啟了flash-attn的支持)架構(gòu)模型分別用1,000萬條中英平行語料,基于同樣軟硬件環(huán)境的NVIDIA A800服務(wù)器訓(xùn)練以及同樣的迭代次數(shù)下進(jìn)行了對(duì)照試驗(yàn):(1)訓(xùn)練效率方面,在上述對(duì)照實(shí)驗(yàn)環(huán)境下Yan 1.0模型的損失值要低于Transformer架構(gòu)的LLaMA 2模型。在訓(xùn)練集上,訓(xùn)練數(shù)據(jù)收斂到相同的loss(loss=3.0)時(shí),Yan 1.0模型僅需要1.5小時(shí),而LLaMA 2模型卻花費(fèi)10.5小時(shí),因此Yan 1.0模型的訓(xùn)練效率更高。(2)推理準(zhǔn)確率方面,在上述對(duì)照實(shí)驗(yàn)環(huán)境下Yan 1.0模型比LLaMA 2模型在訓(xùn)練集上的預(yù)測(cè)準(zhǔn)確率高出17%、在驗(yàn)證集上的預(yù)測(cè)準(zhǔn)確率高出13%。(3)記憶能力方面,古詩是通過簡短的字和詞語表達(dá)豐富語境的一種體裁,token之間的困惑度也高于現(xiàn)代文,這恰好可用于評(píng)測(cè)模型的記憶能力。在對(duì)照實(shí)驗(yàn)中分別用數(shù)十萬條古詩數(shù)據(jù)進(jìn)行續(xù)寫訓(xùn)練,與LLaMA 2模型相比,Yan 1.0能夠更快的達(dá)到更好的收斂,以及更高的準(zhǔn)確率。(4)顯存占用方面,基于同樣的參數(shù)量級(jí)在單張NVIDIA RTX 4090 24G顯卡上,當(dāng)輸出token的長度超出2,600時(shí),LLaMA 2模型會(huì)出現(xiàn)顯存不足,進(jìn)而無法完成推理;Yan 1.0模型的顯存使用始終穩(wěn)定在14G左右,可以進(jìn)行正常推理。Yan 1.0模型的顯存占用及成本比LLaMA 2模型更低。巖芯數(shù)智團(tuán)隊(duì)目前正在研發(fā)Yan 2.0模型,Yan 2.0模型將會(huì)融合文字、音頻、視頻等多模態(tài),以應(yīng)用于更廣泛的業(yè)務(wù)。Yan 2.0模型預(yù)計(jì)將于2024年下半年推出,具體推出時(shí)間請(qǐng)以后續(xù)巖芯數(shù)智的發(fā)布為準(zhǔn)。公司提醒投資者警惕市場熱點(diǎn)炒作,理性投資并注意投資風(fēng)險(xiǎn)。謝謝。
投資者:目前最新的股東數(shù)是多少?
巖山科技董秘:您好,感謝對(duì)公司的關(guān)注。公司將在定期報(bào)告中披露對(duì)應(yīng)時(shí)點(diǎn)的股東信息,敬請(qǐng)關(guān)注。謝謝。
投資者:請(qǐng)問; Yan 2.0計(jì)劃何時(shí)推出?是否具有文生視頻功能?謝謝
巖山科技董秘:您好,感謝對(duì)公司的關(guān)注。巖芯數(shù)智團(tuán)隊(duì)目前正在研發(fā)Yan 2.0模型,Yan 2.0模型將會(huì)融合文字、音頻、視頻等多模態(tài),以應(yīng)用于更廣泛的業(yè)務(wù)。Yan 2.0模型預(yù)計(jì)將于2024年下半年推出,具體推出時(shí)間請(qǐng)以后續(xù)巖芯數(shù)智的發(fā)布為準(zhǔn)。公司提醒投資者警惕市場熱點(diǎn)炒作,理性投資并注意投資風(fēng)險(xiǎn)。謝謝。
投資者:貴公司Yao2.0的研發(fā)有什么進(jìn)展?是多模態(tài)的嗎?
巖山科技董秘:您好,感謝對(duì)公司的關(guān)注。巖芯數(shù)智團(tuán)隊(duì)目前正在研發(fā)Yan 2.0模型,Yan 2.0模型將會(huì)融合文字、音頻、視頻等多模態(tài),以應(yīng)用于更廣泛的業(yè)務(wù)。Yan 2.0模型預(yù)計(jì)將于2024年下半年推出,具體推出時(shí)間請(qǐng)以后續(xù)巖芯數(shù)智的發(fā)布為準(zhǔn)。公司提醒投資者警惕市場熱點(diǎn)炒作,理性投資并注意投資風(fēng)險(xiǎn)。謝謝。
投資者:請(qǐng)問非attention機(jī)制大模型通俗的說是啥意思?
巖山科技董秘:您好,感謝對(duì)公司的關(guān)注。Attention機(jī)制是一種能讓模型對(duì)關(guān)鍵信息重點(diǎn)關(guān)注并充分學(xué)習(xí)吸收的技術(shù),也就是把注意力集中放在重要的點(diǎn)上,而忽略其他不重要的因素。ChatGPT等都利用了Transformer架構(gòu),其核心技術(shù)之一就是Attention機(jī)制。標(biāo)準(zhǔn)的Attention機(jī)制的計(jì)算復(fù)雜度為O(n^2?d)(其中n表示序列長度、d表示特征維度,^2指平方)。標(biāo)準(zhǔn)Attention機(jī)制的復(fù)雜度隨序列長度呈2次方增長。通常來說Transformer架構(gòu)具有訓(xùn)練周期較長、應(yīng)用成本過高、高機(jī)器幻覺表達(dá)等缺陷,在實(shí)際應(yīng)用中需要的高算力和高成本讓不少中小型企業(yè)望而卻步。針對(duì)Transformer架構(gòu)的上述缺陷、以及不同行業(yè)對(duì)于高效能、低能耗AI大模型需求的不斷增長,公司旗下巖芯數(shù)智研發(fā)團(tuán)隊(duì)意識(shí)到從零開始設(shè)計(jì)大模型的必要性,并推出了國內(nèi)首個(gè)非Attention機(jī)制大模型—Yan 1.0模型。Yan架構(gòu)沒有基于Attention機(jī)制,也沒有基于RNN(指Recurrent Neural Network,循環(huán)神經(jīng)網(wǎng)絡(luò))等序列模型,而是通過完全自研的記憶算子及特征關(guān)聯(lián)函數(shù),將計(jì)算復(fù)雜度從標(biāo)準(zhǔn)Attention機(jī)制的O(n^2?d)降低為O(n?d)(線性復(fù)雜度),從而提高了Yan架構(gòu)模型的訓(xùn)練效率和收斂速度。謝謝。
投資者:公司近日在介紹類腦大模型時(shí)說,有關(guān)技術(shù)還在研究之中,尚未產(chǎn)生收入。公司董事長先生,現(xiàn)在新科技更新?lián)Q代周期越來越短,請(qǐng)問貴公司類腦人機(jī)接口等新科技,估算何時(shí)能出科研成果?今年年底能產(chǎn)生效益嗎?
巖山科技董秘:您好,感謝對(duì)公司的關(guān)注。巖思類腦研究院的腦電大模型目前尚處于研究階段,尚未產(chǎn)生營業(yè)收入??蒲谐晒瞥鰰r(shí)間請(qǐng)以后續(xù)巖思類腦的發(fā)布為準(zhǔn)。同時(shí)公司提醒投資者警惕市場熱點(diǎn)炒作,理性投資并注意投資風(fēng)險(xiǎn)。謝謝。
投資者:請(qǐng)問貴公司目前涉及芯片半導(dǎo)體業(yè)務(wù)嗎?
巖山科技董秘:您好,感謝對(duì)公司的關(guān)注。公司的主營業(yè)務(wù)包括互聯(lián)網(wǎng)信息服務(wù)業(yè)務(wù)、人工智能業(yè)務(wù)和多元投資業(yè)務(wù),不涉及芯片半導(dǎo)體業(yè)務(wù)。謝謝。
模型,Yan,訓(xùn)練






