E464 🍭[Roadmap] ms-swift3.9-3.11 · Issue #5721 · modelscope/ms-swift · GitHub
[go: up one dir, main page]

Skip to content

🍭[Roadmap] ms-swift3.9-3.11 #5721

@Jintao-Huang

Description

@Jintao-Huang

模型

  1. 最新模型接入 P0

训练

  1. RAY支持 P0
  2. 多模态padding_free/packing支持更多模型
  3. 混合数据训练支持更多多模态模型
  4. agent template支持更多模型
  5. ✅ulysses & ring attention混合使用支持
  6. ✅embedding & reranker 数据集格式重构
  7. ms-swift目录结构重构

Megatron-SWIFT

  1. 新模型支持 P0
  2. blockwise fp8 P1
  3. RLHF支持 P0
    a. GRPO
    b. KTO
  4. swanlab支持
  5. 分类/Embedding模型支持 P0
  6. Deepspeed集成
  7. LoRA权重不进行merge导出HF
  8. 权重转换优化:
    a. 多机转换
    b. 去除transformers和megatron格式转换的步骤
  9. 按epoch保存; save_total_limit; vp; 异步存储支持 P0
  10. 升级megatron-core 0.14
  11. 多模态支持 ViT部分性能优化
  12. megatron infer/deploy/eval模块支持

RL

  1. GRPO
    a. 权重同步优化(LoRA/MoE)
    b. 训练显存优化
    c. ✅CHORD
    b. Agent MCP
    c. sglang
    d. 效率对比benchmark
  2. RLOO P1
  3. Reinforce++ P0
  4. KTO padding_free支持
  5. RM 支持 pointwise 训练 P0
  6. liger_kernel显存优化

推理部署

  1. reranker推理部署支持 P0
  2. sglang支持多模态模型
  3. vllm/sglang支持分类模型/RM

量化

  1. 量化支持更多类型模型:embedding/reranker/多分类等 P2
  2. GPTQ/AWQ升级 P2

ms-swift3.6-3.8 Roadmap: #4561

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions

      0