代码生成模型微调

训练中

使用代码指令数据集对DeepSeek-Coder进行微调，提升代码生成能力

基础模型

DeepSeek-Coder-7B-Instruct

微调方法

QLoRA (4-bit)

训练数据量

90,000 条

预计剩余

2h 35m

训练进度Epoch 2/3 | Step 8,125/12,500

Loss: 0.345665%

基本信息

q_projk_projv_projo_projgate_projup_projdown_proj

[2025-12-21 09:00:15] 开始加载模型 DeepSeek-Coder-7B-Instruct...

[2025-12-21 09:02:30] 模型加载完成，应用 4-bit 量化

[2025-12-21 09:02:35] 应用 QLoRA 配置: rank=16, alpha=32

[2025-12-21 09:02:40] 可训练参数: 8,388,608 (0.11%)

[2025-12-21 09:03:00] 开始加载数据集...

[2025-12-21 09:04:15] 数据集加载完成: 训练集 90,000 条, 验证集 10,000 条

[2025-12-21 09:04:20] 开始训练...

[2025-12-21 09:04:20] Epoch 1/3

[2025-12-21 11:14:30] Epoch 1 完成 - train_loss: 0.5123, val_loss: 0.4892

[2025-12-21 11:14:35] Epoch 2/3

[2025-12-21 12:30:00] Step 8125/12500 - loss: 0.3456, lr: 1.56e-04