塔斯娱乐资讯网

说到在国产芯片上进行训练和推理,早就跑通了。先说推理,硅基流动早就用国产芯片进行

说到在国产芯片上进行训练和推理,早就跑通了。

先说推理,硅基流动早就用国产芯片进行推理了,而且已经商业化了。下半年,deepseek官方也会上很多国产芯片进行推理扩容,这方面进行商业化,问题是不大的。

训练方面,科大讯飞早就是用国产芯片训练了。去年,星火X1.5大模型就是用国产芯片训练的MoE大模型,这也是商用的。

这次用国产芯片进行deepseek的后训练,是学生们跑的,数据量也不大。1500多步,可以鼓励一下。

一些人过来骂骂咧咧,就是不知道早就商业化的信息,纯搞笑的。早就跑通的东西,你激动个啥?