只要一想到这些女生,龚青青就觉得十分烦躁,明明她们和许秋什么关系都没有,自己就是非常讨厌。
“如果只有自己就好了。”
“为什么,为什么不能喜欢我啊。”
“还有机会,不要着急,我一定会让你爱上我。”
被子里传出压抑的低吼,声音里透出一丝坚决和疯狂。
不知过了多久,龚青青从被子里钻出来。
她将被褥恢复原样,又小心检查是否有自己的发丝,确认不会被发现后才走出房间。
龚青青微微一笑,再次变成那个软萌可爱的元气美少女。
她点开许秋的头像,熟练的发过去一条信息。
“许秋,你在干嘛呀,什么时候回来。”
“周阿姨刚刚把东西给我,不出意外的话,晚上从浮光下班就回来,饿了可以点外卖,不要吃冰的。”
许秋很快回了消息,最后还有一笔转账,像是怕她饿着。
“许秋,你真好。”
“我身上还有钱,不用担心。”
只是因为对方的一句话,原本烦闷的心情,瞬间晴空万里。
龚青青把手机抱在胸前,发出痴痴的笑声,又哒哒哒跑进自己卧室把伊娃拿出来。
“瓦力,你会永远爱伊娃的对吗?”
“伊娃。”
……
五月一号,许秋将deepseik源代码全部复现,拿着源代码在国家网站上进行软件著作权登记。
因为版权问题,许秋无奈舍弃初音这个名字,换了个更具东大特色的名字——“白泽”。
第二天许秋找到阿里云计算官网,租用了四台rtx3090 24g显卡。
他原本想用a100,结果阿里云计算中心回复许秋,暂时不支持个人租用,想用的话就要注册公司走对公账户。
7b版本跑不出来,低配版勉强能用。
“端侧人工智能的话,用1.5b就行。”
许秋在文档里放入提前准备好的各种训练数据,其中包括许秋和龚青青的一些音像数据。
“加上这些就能让机器人说我们的声音吗?”
龚青青把小脑袋放到许秋肩上,看着那不断流动的代码流。
看不懂,但是感觉很厉害!
“后面再录一些我们的声音,应该就差不多了。”
许秋也没把握,他也是第一次全流程训练人工智能,最后结果怎么样还不清楚。
如果不是前世deepseik全部开源,他也专门研究过,想要一个人将人工智能底座大模型手搓出来,简直就是痴人说梦,
接下来几天时间,许秋又马不停蹄的安装cuda11.7驱动,手动编译flash attention,将白泽源代码本地调试了一下,没有bug后才放心。
把购买的训练数据再次清洗,主要是去重,将格式统一,光训练数据许秋就花了整整十万。
tokenize处理完,用白泽原生tokenizer,打包成训练专用bin格式。
做完这一切,就只差最后将训练参数导入算力群。
“那这个白泽什么时候才能出来啊。”
龚青青想帮忙又发现自己什么都不懂,只能眼巴巴盯着许秋忙碌。
“顺利的话,最快半个月就可以跑出来。”
全部事情搞定,许秋兴奋的搓着手。
剩下的就是实时监控loss,看gpu是否负载,集群是否稳定,如果崩溃还要排查日志,微调参数。</p>