Go to file
2025-05-15 15:40:00 +08:00
.vscode feat: 添加VSCode设置文件,配置Python分析路径 2025-05-15 15:40:00 +08:00
src feat: 添加VSCode设置文件,配置Python分析路径 2025-05-15 15:40:00 +08:00
.gitignore feat: 更新数据集处理逻辑,添加Gigaspeech、TextVQA数据集支持,优化训练脚本,增加测试用例 2025-01-18 21:37:15 +08:00
.gitmodules feat: 添加子模块支持,更新数据集处理逻辑,优化训练和评估脚本 2025-01-15 21:56:20 +08:00
.pre-commit-config.yaml feat: 更新数据集处理逻辑,优化图像大小调整,添加生成数据的功能 2025-01-18 03:48:13 +08:00
.python-version feat: 更新Python版本和依赖管理,优化训练脚本以支持Flash Attention 2 2025-01-11 03:53:23 +08:00
install.sh feat: 更新Python版本和依赖管理,优化训练脚本以支持Flash Attention 2 2025-01-11 03:53:23 +08:00
LICENSE Initial commit 2024-12-29 14:54:14 +08:00
pyproject.toml FIX: 调试 _maybe_include_all_linear_layers 函数,添加打印线性模块名称 2025-05-15 15:35:11 +08:00
README.md feat: 在README中添加克隆仓库的说明 2025-01-15 22:07:09 +08:00
uv.lock FIX: 调试 _maybe_include_all_linear_layers 函数,添加打印线性模块名称 2025-05-15 15:35:11 +08:00

CL-LMM

Clone Repo

git submodule update --init --progress 

Requirements

uv sync
uv sync --extra compile

Scripts

uv run -- ./train.sh
uv run -- ./evaluation.sh

Recommand Structure

.
├── install.sh
├── LICENSE
├── pyproject.toml
├── README.md
├── rsync.sh
├── src
│   ├── configs
│   ├── dataset_library
│   ├── evaluation.py
│   ├── evaluation.sh
│   ├── model_library
│   ├── peft_library
│   ├── todo.md
│   ├── train.py
│   ├── train.sh
│   └── utils
├── dataset
│   ├── chem
│   │   ├── conversations_loc_train.jsonl
│   │   ├── conversations_loc_val.jsonl
│   │   └── images
│   ├── OCR-VQA-200K
│   │   ├── dataset.json
│   │   ├── images
│   │   ├── LICENCE.txt
│   │   └── loadDataset.py
│   └── TextCaps
│       ├── TextCaps_0.1_train.json
│       ├── train_val_images.zip
│       └── wget-log
└── uv.lock