“这是bIR算法核心参数啊!”
晚上10点,沈月紧急召开公司线上会议,让研究院专家看网盘资料。
研究院有AI算法团队,几位资深工程师很快做出判断:
“看上去,正好是攻坚课题需要的。”
“用于大模型IR算法。”
“先做了小样本集训练,得到一组效果最优的参数。”
“有这组参数,可以做大范围训练,得到重建算法需要的大模型!”
“跑完训练再用模型检验,做低剂量ct能达到什么重建效果。”
有人问参数是从哪里来的,沈月说是跟GE私下买的,具体不能透露。
这是跟王霁商量的口径。
秘密必须控制在萧家范围内。
从文件内容可以看出,曹海确实有了突破进展,接下来,萧氏医疗需要继承他的遗志,训练出模型并检验成果。
沈月问团队:“需要多少算力资源?多久能训练完?”
研究院主任回答:“最好有3千张卡,按汇总数据量估计,跑2个月吧。”
为打赢专项攻坚战,卫健委做了大量协调,各医院都提供了数据。
训练集不是问题,难的是算法。
以及算力资源。
毕竟萧氏医疗不是大模型公司,没有这么多GpU卡。
主任本想开口要1万张,怕被骂狮子大开口,最终打了个3折。
其实,3千张也是搞不到的。
别说3千张,1千张都没有……
沈月沉吟片刻,摇摇头:
“卡我来弄,你们要赶时间!”
“第一次专项汇报是9月15号,算周末只有8天时间。”
“咱们只有一组参数,还不确定效果如何,这样没法汇报……”
“我听说智愈医疗已经有完整方案,准备开始训练了!”
“他们有来自西门子的专家,在立项投入、团队资质方面都占优,肯定会宣布一个激进的项目计划,博取认可。”
“三家竞争企业里,咱们处于下风,首次汇报必须有说服力!”
研究院专家们都低着头,听说只有8天时间,没人敢吭声。
王霁对沈月道:
“时间太紧,3千张卡算力很难搞到。”
“即便能从各处协调到卡,还需要汇集到一个机房。”
“从来源地结束任务、下架拔卡、物流、协调上架,半个月就过去了。”
“腾云也没有这个规模的机房,而且算力都租出去了。”
“我可以从其他地方找机房,1千张oK,但3千张够呛。”
AI训练还没法做到去中心化,得在一个机房训练,否则数据传输的带宽是巨大开销,而且延迟高、任务不稳定。
想要8天解决,不止是训练量,连算力也很难找到。
这时,研究院一位工程师开口:
“除非……”
“能再优化算法,减少算力需求。”
“咱们用的是开源bIR算法,也许存在优化的空间。”
“但我们以使用为主,对里边的原理,没有人特别精通……”
“如果能找个大牛过一遍算法,没准可以找出优化点。”
“只要优化2\/3执行效率,1千张卡就能当3千张用了。”
沈月叹了口气:“咱们以前没积累过这方面专家,哪有现成大牛用?”
算力、时间都是问题,她心气一下低落不少。
如果3千张卡需要2个月,1千张卡至少要……
半年!
这意味着,几个汇报节点毫无产出。
跟对手差距越来越远,基本没戏了。
王霁忽然开口:“别担心,算力和算法优化,我来解决。”
萧恒、沈月脸上满是感激和欣慰,小雪见男朋友为她家的事这么上心,立刻又兴奋起来,忙问:“你有办法?”
王霁笑道:“我认识些精通算法的人,我试试看,应该有戏。”
第九中文网