Go to file
2025-01-15 21:58:26 +08:00
src feat: 更新子模块到最新提交 2025-01-15 21:58:26 +08:00
.gitignore 更新.gitignore以排除rsync.sh,修改TODO列表,重命名evaluate脚本,删除run.sh,添加持续学习的参数类,更新训练和评估脚本以支持新的数据集逻辑 2025-01-01 17:24:32 +08:00
.gitmodules feat: 添加子模块支持,更新数据集处理逻辑,优化训练和评估脚本 2025-01-15 21:56:20 +08:00
.python-version feat: 更新Python版本和依赖管理,优化训练脚本以支持Flash Attention 2 2025-01-11 03:53:23 +08:00
install.sh feat: 更新Python版本和依赖管理,优化训练脚本以支持Flash Attention 2 2025-01-11 03:53:23 +08:00
LICENSE Initial commit 2024-12-29 14:54:14 +08:00
pyproject.toml feat: 更新依赖项,修改数据集名称为CHEM,优化训练和评估脚本,添加原始数据支持 2025-01-15 03:48:58 +08:00
README.md feat: 更新依赖项,修改数据集名称为CHEM,优化训练和评估脚本,添加原始数据支持 2025-01-15 03:48:58 +08:00
uv.lock feat: 更新依赖项,修改数据集名称为CHEM,优化训练和评估脚本,添加原始数据支持 2025-01-15 03:48:58 +08:00

CL-LMM

Requirements

uv sync
uv sync --extra compile

Scripts

uv run -- ./train.sh
uv run -- ./evaluation.sh

Recommand Structure

.
├── install.sh
├── LICENSE
├── pyproject.toml
├── README.md
├── rsync.sh
├── src
│   ├── configs
│   ├── dataset_library
│   ├── evaluation.py
│   ├── evaluation.sh
│   ├── model_library
│   ├── peft_library
│   ├── todo.md
│   ├── train.py
│   ├── train.sh
│   └── utils
├── dataset
│   ├── chem
│   │   ├── conversations_loc_train.jsonl
│   │   ├── conversations_loc_val.jsonl
│   │   └── images
│   ├── OCR-VQA-200K
│   │   ├── dataset.json
│   │   ├── images
│   │   ├── LICENCE.txt
│   │   └── loadDataset.py
│   └── TextCaps
│       ├── TextCaps_0.1_train.json
│       ├── train_val_images.zip
│       └── wget-log
└── uv.lock