【万字长文】LLaMA, ChatGLM, BLOOM的参数高效微调实践

「爱情、让人受尽委屈。」 2023-10-14 15:29 18阅读 0赞

发表评论取消回复

表情：

评论列表（有 0 条评论，18人围观）

还没有评论，来说两句吧...

相关阅读

相关 ChatGLM多卡微调踩坑记录

题主近期尝试使用LoRA在自有数据上微调ChatGLM，尽管GitHub上已有很多LoRA相关代码，但实现过程中题主还是遇到了很多问题，现将遇到的问题整理出来供大家参考，实现的

川长思鸟来/ 2024年03月16日 19:41/ 0 赞/ 22 阅读

相关【ChatGLM3】微调指南

下载数据集ToolAlpaca 从GitHub下载 cd ChatGLM3/finetune_chatmodel_demo git clone h

灰太狼/ 2024年02月05日 23:04/ 0 赞/ 78 阅读

相关【万字长文】LLaMA, ChatGLM, BLOOM的参数高效微调实践

1. 开源基座模型对比大语言模型的训练分为两个阶段：（1）在海量文本语料上的无监督预训练，学习通用的语义表示和世界知识。（2）在小规模数据上，进行指令微调和基于人类反馈

「爱情、让人受尽委屈。」/ 2023年10月14日 15:29/ 0 赞/ 19 阅读

相关 AIGC｜FineTune工程之LoRa高效参数微调

徐辉 | 后端开发工程师一、引言随着深度学习和自然语言处理技术的快速发展，大型预训练语言模型（如GPT、Vicuna、Alpaca、Llama、ChatGLM等）在

朱雀/ 2023年10月13日 13:01/ 0 赞/ 19 阅读

相关 LLM-LLaMA中文衍生模型：Chinese-LLaMA-Alpaca【扩充词表、Lora部分参数预训练、微调】

GitHub：[GitHub - ymcui/Chinese-LLaMA-Alpaca: 中文LLaMA&Alpaca大语言模型+本地CPU/GPU训练部署 (Chinese

忘是亡心i/ 2023年10月12日 21:04/ 0 赞/ 64 阅读

相关 LLM-微调-方案（一）：Lora【案例：chatGLM-Lora】【在chatGLM原有结构中间插入新的网络层】【微调时冻结原有结构参数，只微调新加入的网络层参数】

Lora主要在模型中注入可训练模块，大模型在预训练完收敛之后模型包含许多进行矩阵乘法的稠密层，这些层通常是满秩的，在微调过程中其实改变量是比较小的，在矩阵乘法中表现为低秩的改变

不念不忘少年蓝@/ 2023年10月12日 10:38/ 0 赞/ 61 阅读

相关 Flink 1.14.0 内存优化（万字长文+参数调优）

本文转载于：[Flink 1.14.0 内存优化你不懂？跟着土哥走就对了（万字长文+参数调优）\_逆流而上Mr李-CSDN博客][Flink 1.14.0 _Mr_-CSDN]

爱被打了一巴掌/ 2022年09月15日 05:44/ 0 赞/ 12 阅读

相关万字长文带你入门Istio

1. 简介在本教程中，我们将介绍服务网格的基础知识，并了解它如何实现分布式系统架构。我们将主要关注Istio，它是服务网格的一种具体实现。在此过程中，我们将

╰+哭是因爲堅強的太久メ/ 2022年09月03日 13:12/ 0 赞/ 300 阅读

相关万字长文！java获取时间戳的方法

前言一次偶然，从朋友那里得到一份“java高分面试指南”，里面涵盖了25个分类的面试题以及详细的解析：JavaOOP、Java集合/泛型、Java中的IO与NIO、Ja

╰+哭是因爲堅強的太久メ/ 2021年07月20日 20:40/ 0 赞/ 616 阅读

相关下列哪些不是java关键字，万字长文！

一. 为什么使用spring cloud alibaba 很多人可能会问，有了spring cloud这个微服务的框架，为什么又要使用spring cloud aliba

墨蓝/ 2021年07月20日 18:52/ 0 赞/ 397 阅读