关于#深度学习#的问题：穷学生没办法负担太多，但不太想把东西放到实验室的server（也是非工业显卡）上跑(语言-python)

想请问各位有经验的学长姐们，
如果想要做有关LLM的tranfer learning，
像是拿LLaMA 3来fine-tune，
请问以现在的非工业显卡和cpu可否推荐一个性价比比较高的台式机菜单？
穷学生没办法负担太多，
但可以跟父母商量一下，

主要是不太想把东西放到实验室的server（也是非工业显卡）上跑，个人比较注重隐私，加上人不在学校附近（跟advisor商量回家线上meeting了）

谢谢

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
吃不了席 2024-09-05 01:19
关注
以下回复参考：皆我百晓生、券券喵儿等免费微信小程序作答:

要解决这个问题，我们可以考虑一些开源库，如PyTorch、TensorFlow等，这些库提供了丰富的API，可以帮助我们实现深层学习任务。此外，Python本身也是一种强大的编程语言，可以用来开发和训练模型。

对于非工业级别的显卡，我们可以选择使用GPU加速器，如NVIDIA的GeForce RTX系列显卡。这些显卡性能优越，且价格相对合理，适合在家庭或小型实验室中运行深度学习工作负载。

为了节省成本并提高效率，我们可以利用分布式计算技术，将数据集分割成多个小块，然后分别交给不同的节点进行处理和存储。这可以通过使用分布式文件系统如Hadoop或者Dask来进行，并利用Python的分布式框架如Dask进行管理。

例如，如果你正在使用TensorFlow，可以考虑使用tf.distribute.Strategy类来设置策略，从而让模型可以在多台机器上并行训练。同时，可以考虑使用dask.distributed.Client来创建一个分布式客户端，以便将数据分布到各个节点上。

下面是一个简单的例子：

from dask import dataframe as dd import numpy as np from sklearn.model_selection import train_test_split from tensorflow.keras.preprocessing.sequence import pad_sequences from tensorflow.keras.models import Sequential from tensorflow.keras.layers import Dense, Embedding, LSTM, Dropout from tensorflow.keras.optimizers import Adam # 加载数据 data = pd.read_csv('your_data.csv') # 分割数据为训练集和测试集 train_data, test_data = train_test_split(data, test_size=0.2) # 将DataFrame转换为Dask DataFrame df_train = dd.from_pandas(train_data, npartitions=4) df_test = dd.from_pandas(test_data, npartitions=4) # 对序列化文本进行预处理 def preprocess(text): return text.lower() train_text = df_train['text'].apply(preprocess).compute() test_text = df_test['text'].apply(preprocess).compute() # 对文本进行分词和填充 max_len = 100 train_seq = pad_sequences(df_train['text'], maxlen=max_len) test_seq = pad_sequences(df_test['text'], maxlen=max_len) # 构建模型 model = Sequential([ Embedding(input_dim=len(train_text), output_dim=64), LSTM(units=64, dropout=0.5, recurrent_dropout=0.5), Dense(1, activation='sigmoid') ]) # 编译模型 model.compile(loss='binary_crossentropy', optimizer=Adam(lr=0.001), metrics=['accuracy']) # 训练模型 history = model.fit(train_seq, df_train['label'], epochs=10, batch_size=32, validation_data=(test_seq, df_test['label'])) # 预测 predictions = model.predict(test_seq)

这个例子展示了如何使用Dask和TensorFlow构建一个基本的LSTM分类器。当然，你需要根据你的具体需求调整参数和结构。

请注意，上述代码仅为示例，实际应用可能需要更复杂的配置和优化。另外，确保你的服务器有足够的内存和带宽支持模型训练和推理。
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

关于#深度学习#的问题： bert 深度学习自然语言处理
2023-02-11 15:35

回答 4 已采纳有些模型，不是公开的，或者需要一些协议，必须登录才行。你参考下 https://blog.csdn.net/YI_SHU_JIA/article/details/127490591
关于#深度学习#的问题：安装cuda问题深度学习
2023-03-22 18:46

回答 2 已采纳这个路径只是用来释放安装程序的临时路径（而不是程序被安装到的路径），然后才是正式的安装，所以这个路径在哪里无所谓
关于#深度学习#的问题：用adaboost或者xgboost算法把pytorch上的三个网络集成 pytorch 深度学习神经网络
2023-02-19 15:19

回答 1 已采纳对于集成多个PyTorch模型，可以使用以下步骤： 1.定义数据集并进行数据预处理。 2.分别定义和训练每个模型。可以使用不同的超参数和损失函数来训练每个模型以提高模型的多样性。 3.在每个模型上进行
软考中级网络工程师全面学习笔记第2版(5万字)+配套视频及课件
2022-08-04 22:04

小猿网的博客 1、文件包括网工第五版软考...对于相应的笔记文档的话，这里笔记只有一个文件且体积小也可以编辑，如果是用着WPS云文档也可上传到自己的云文档中，排版的也还可以，即便是打印出来也可以很好的进行阅读与查看 .........
关于#深度学习#的问题：怎么将氨基酸序列数据处理后经过图神经网络进行分类(语言-python) python 分类深度学习
2023-03-18 16:25

回答 3 已采纳参考GPT和自己的思路：对于将氨基酸序列数据处理后经过图神经网络进行分类的问题，可以按照以下步骤进行：将氨基酸序列转换为图结构将氨基酸序列转换为图结构是将氨基酸序列数据处理后进行分类的第一步。可
关于#深度学习#的问题：请问一下训练yolov5 的这样的坐标：726 472 999 630 0 怎么转化为txt 深度学习
2022-11-14 15:38

回答 2 已采纳看我最新的文章（我用的是Linux，如果你用win系统，你写路径时注意改一下），专门你写的哦。希望能有帮助
关于#深度学习#的问题，如何解决？有问必答深度学习目标检测神经网络
2023-03-21 14:33

回答 2 已采纳首选数据：收集目标物体的三维模型数据，并使用计算机图形学软件将其转换为点云或网格数据格式。同时，提取出螺栓所在位置的边界框（bounding box）作为标注。接着模型训练：使用深度学习方法，如卷积
迁移学习——学习资料汇总：网页论坛、视频资源，相关学者大佬
2024-08-15 19:52

Arya's Blog的博客迁移学习——学习资料汇总：网页论坛、视频资源，相关学者大佬
关于#神经网络#的问题：RuntimeError: mat1 and mat2 shapes cannot be multiplied (64x64 and 128x64) pytorch 深度学习神经网络
2023-02-08 20:16

回答 3 已采纳问题在后面的 model(data[0])，data 和 x 不匹配，设置错误. 可以打印和追踪矩阵的形状，是开始设置时就不匹配，还是中间被修改了，在哪里发生修改的。
关于#深度学习#的问题，语义分割数据集制作(语言-python) python 深度学习
2022-08-25 16:45

回答 3 已采纳 labelme支持打开tif图进行标注，同时labelme生成的标注是json格式与显卡无关，labelme生成的json标注还需要通过特定的转换代码才能生成mask图
关于#深度学习知识蒸馏算法loss函数计算#的问题？ python 人工智能深度学习
2022-08-12 14:57

回答 1 已采纳原论文是第一种，所以用第一种肯定没问题，第二种也有人用，主要是为了保证两个loss贡献差不多，毕竟softloss里有做平滑，所以都可以哈，还是要看哪种收敛更快，效果很好
迁移学习——学习资料汇总：网页论坛、视频资源
2024-08-07 13:45

Arya's Blog的博客迁移学习——学习资料汇总：网页论坛、视频资源
聊聊炼丹效率
2022-04-18 00:00

Tom Hardy的博客作者丨欧泽彬@西湖大学张岳课题组（已授权）来源丨...高效一点的操作是写一个 bash script 然后用 for loop 把实验跑完，但似乎每次跑实验效率还是比较低，一轮下来也相当累人。总结下来有以下问...
在课堂中使用 ChatGPT 的 80 个方式（上）
2024-04-01 21:54

绝不原创的飞龙的博客在教育领域，阵营分为那些希望禁止 chatGPT 的人，因为他们认为这是学生作弊的一种方式。相反，其他人则将其视为延伸学习的工具。作为一名教学技术专家，我看到 chatGPT 有巨大潜力。我已经开始使用它来支持我合作的...
《新程序员005：开源深度指南&新金融背后的科技力量》
2023-06-01 01:06

答案说明所有。的博客各位CSDN的uu们你们好呀，今天，小雅兰来写书评啦，尽管再忙，也不能不读书，下面，就让小雅兰来带你们走进《新程序员005：开源深度指南&新金融背后的科技力量》这本书的世界吧！！！邹欣对话Python之父：人类的...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 9月5日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 9月5日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 9月5日

悬赏问题

¥15 如何在vue.config.js中读取到public文件夹下window.APP_CONFIG.API_BASE_URL的值
¥50 浦育平台scratch图形化编程
¥20 求这个的原理图只要原理图
¥15 vue2项目中，如何配置环境，可以在打完包之后修改请求的服务器地址
¥20 微信的店铺小程序如何修改背景图
¥15 UE5.1局部变量对蓝图不可见
¥15 一共有五道问题关于整数幂的运算还有房间号码还有网络密码的解答？(语言-python)
¥20 sentry如何捕获上传Android ndk 崩溃
¥15 在做logistic回归模型限制性立方条图时候，不能出完整图的困难
¥15 G0系列单片机HAL库中景园gc9307液晶驱动芯片无法使用硬件SPI+DMA驱动，如何解决？

关于#深度学习#的问题：穷学生没办法负担太多，但不太想把东西放到实验室的server（也是非工业显卡）上跑(语言-python)

3条回答 默认 最新

问题事件

悬赏问题

3条回答默认最新