学习大模型LLM，有没有推荐的课看看，如何解决？

学习大模型LLM，大模型微调，有没有推荐的课看看
学习大模型LLM，大模型微调，有没有推荐的课看看
学习大模型LLM，大模型微调，有没有推荐的课看看

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

7条回答默认最新

阿里嘎多学长 2025-09-18 14:44

关注

阿里嘎多学长整理AIGC生成，因移动端显示问题导致当前答案未能完全显示，请使用PC端查看更加详细的解答过程

解决方案

学习大模型LLM是一项非常有趣且有潜力的方向。以下是一些在线课程和资源可以帮助你快速入门：

1. Stanford CS224D

课程名称：自然语言处理和信息检索

课程大纲包括语言模型、序列预测、语义表示和语言理解。

2. Coursera - 语言模型（Language Models）

课程由Stanford大学和Google联合提供，涵盖语言模型的基本概念与应用。

3. edX - 语言模型与深度学习（Language Models and Deep Learning）

由麻省理工学院（MIT）提供的 courses，涵盖语言模型与深度学习。

4. PyTorch tutorials - LLM 微调

PyTorch 提供的 LLM 微调教程，帮助你快速开始大模型的微调工作。

5. GitHub - Transformer-XL

一个非常有名的超越 Transformers 的 Transformer-XL，提供了实现大模型的例子。

推荐阅读

大模型（LLM）的定义及其应用：《Large Language Model in Action》
transformer 架构及其在 NLP 中的应用：《Attention is All You Need》

代码片段

下面是一个简单的例子，展示了如何使用 PyTorch 来实现大模型的微调：

#导入必要的库
import torch
import torch.nn as nn
from transformers import AutoModelForSequenceClassification, AutoTokenizer

# 加载预训练模型和tokenizer
model = AutoModelForSequenceClassification.from_pretrained("bert-base-uncased")
tokenizer = AutoTokenizer.from_pretrained("bert-base-uncased")

#定义数据读取函数
def read_data(file_path):
    # 读取数据
    with open(file_path, 'r', encoding='utf-8') as fr:
        lines = fr.readlines()
    return lines

#定义数据准备函数
def prepare_data(lines):
    inputs = []
    labels = []
    for line in lines:
        # 处理数据
        inputs.append(line.strip().split(",")[0])
        labels.append(line.strip().split(",")[1])
    return inputs, labels

#定义微调函数
def fine_tune(model, tokenizer, inputs, labels):
    # 创建数据加载器
    from torch.utils.data import Dataset, DataLoader
    class MyDataset(Dataset):
        def __init__(self, inputs, labels):
            self.inputs = inputs
            self.labels = labels

        def __getitem__(self, index):
            input_ids = tokenizer.encode(self.inputs[index], return_tensors="pt")
            attention_mask = tokenizer.encode(self.inputs[index], add_special_tokens=False, return_attention_mask=True)
            label = torch.tensor(self.labels[index])
            return input_ids, attention_mask, label

        def __len__(self):
            return len(self.inputs)
    
    dataset = MyDataset(inputs, labels)
    data_loader = DataLoader(dataset, batch_size=16, shuffle=True)
    optimizer = torch.optim.Adam(model.parameters(), lr=1e-5)
    criterion = nn.CrossEntropyLoss()
    model.train()
    for epoch in range(5):
        for batch in data_loader:
            input_ids, attention_mask, label = batch
            input_ids = input_ids.to("cuda:0")
            attention_mask = attention_mask.to("cuda:0")
            label = label.to("cuda:0")
            optimizer.zero_grad()
            out = model(input_ids, attention_mask=attention_mask)
            loss = criterion(out, label)
            loss.backward()
            optimizer.step()
        print(f"Epoch {epoch+1}, Loss: {loss.item():.4f}")

#测试微调函数
model.to("cuda:0")
inputs, labels = read_data("sample.csv"), []
fine_tune(model, tokenizer, inputs, labels)

该代码片段仅是一个简单的示例，请根据实际需求进行调整。

报告相同问题？

关注问题

一文帮你看懂大模型行业黑话：AI、机器学习、大模型、LLM、Agent 都是啥关系？
2025-05-22 12:00

AI大模型进阶教程的博客如果你真的想学习大模型，请不要去网上找那些零零碎碎的教程，真的很难学懂！你可以根据我这个学习路线和系统资料，制定一套学习计划，只要你肯花时间沉下心去学习，它们一定能帮到你！
LLM大模型：从新手到专家：AI大模型学习与实践完全指南
2024-09-06 10:30

大模型老炮的博客大模型，通常指的是在人工智能领域中的大型预训练模型。你可以把它们想象成非常聪明的大脑，这些大脑通过阅读大量的文本、图片、声音等信息，学习到了世界的知识。这些大脑（模型）非常大，有的甚至有几千亿个参数，...
国内外有哪些AI大模型LLM？技术和应用情况如何？
2024-08-14 13:00

AI劳模的博客在核心竞争力上，我国的大模型或许还要更多模型架构、算法优化等方面的研究，好的一面是，在处理中文语料、理解中国文化背景以及适应中国特有的应用场景时具有显著优势，此外文中提到的我国在市场和应用丰富也是我国...
大模型(LLM)到底是什么？和AI有啥关系？
2025-03-13 11:10

大模型玩家的博客大模型很多技术干货，都可以共享给你们，如果你肯花时间沉下心去学习，它们一定能帮到你！
AI初学者必看：什么是大型语言模型 (LLM)？
2024-07-31 11:51

大模型产品经理的博客 人工智能（AI）”一词于 1956 年问世，如今已为大家所熟知。然而，在 ChatGPT 迅速流行之前，AI 的使用和讨论大多局限于科学研究或虚构电影。如今，AI 尤其是生成式 AI 已成为大家热议的话题。初学者生成式人工智能...
大模型基础知识：什么是LLM？非常详细，看这一篇就够了！
2025-04-27 14:08

大模型猫叔的博客本文主要介绍大语言模型（Large Language Model，简称LLM）。前排提示，文末有大模型AGI-CSDN独家资料包哦！通过海量文本训练的、能识别人类语言、执行语言类任务、拥有大量参数的模型，称之为大语言模型。
AI黑话是什么？一文搞明白：AI, 机器学习, 大模型, LLM, Agent 都是啥关系？非常详细建议收藏
2025-05-27 17:41

大模型教程的博客 人工智能（AI）是让机器具备人类智能的终极目标，机器学习（ML）是实现这一目标的核心方法，而深度学习（DL）作为ML的重要分支，通过神经网络自动提取特征推动技术突破。大模型（Large Models）是DL规模化的产物，...
大模型该如何学习？详细的AI大模型学习路线与资料推荐
2024-08-13 10:35

AI大模型学习不迷路的博客 AI大模型知识大体可以分为7个模块，最后给大家推荐几个我入门时做过的项目，帮助大家快速入门人工智能。在AI领域，目前大部分程序员都使用作为第一语言。学会上述操作后就入门了，但一定要将基础部分的内容掌握...
2024初学者怎么入门LLM大语言模型（LLM）？
2024-06-27 10:54

AI大模型教程的博客真的想入门大语言模型，只看这一个文章应该是可以入门的。但是修行下去，还是要靠自己的了！
大模型(LLM)选择指南：AI解决方案的12个决策点
2024-07-24 11:35

大模型入门学习的博客在大模型（LLM）的世界里，选择合适的模型涉及很多考虑因素，包括模型的性能、成本、处理速度、隐私保护以及它是否满足特定的需求。LLM 已经从只能做特定任务的工具，成长为能处理多种任务的强大工具，这大大推动了...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 9月18日