Commit Graph

42 Commits

Author SHA1 Message Date
24a6c3c114 feat: 添加多个数据集的支持,包括Gigaspeech、TextVQA、OCR-VQA-200K、RefCOCO系列,更新数据集工厂和处理逻辑,优化图像处理功能 2025-05-15 20:33:29 +08:00
9ca588224d
feat: 添加VSCode设置文件,配置Python分析路径 2025-05-15 15:40:00 +08:00
da99ec4564
FIX: 调试 _maybe_include_all_linear_layers 函数,添加打印线性模块名称 2025-05-15 15:35:11 +08:00
bcb0494f52
feat: 添加ScienceQA数据集支持,更新数据集工厂和评估逻辑,调整批处理大小 2025-01-19 00:14:03 +08:00
7b9349091e
feat: 更新数据集处理逻辑,添加Gigaspeech、TextVQA数据集支持,优化训练脚本,增加测试用例 2025-01-18 21:37:15 +08:00
da644a081d
feat: 更新数据集处理逻辑,优化图像大小调整,添加生成数据的功能 2025-01-18 03:48:13 +08:00
a38ccf7042
feat: 在README中添加克隆仓库的说明 2025-01-15 22:07:09 +08:00
b2074fdddd
feat: 更新子模块到最新提交 2025-01-15 21:58:26 +08:00
68c3e053fb
feat: 添加子模块支持,更新数据集处理逻辑,优化训练和评估脚本 2025-01-15 21:56:20 +08:00
44b06ea5db
feat: 优化评估工具,添加结果合并和清理功能,改进文件处理逻辑 2025-01-15 04:03:53 +08:00
1b7fea800e
feat: 更新依赖项,修改数据集名称为CHEM,优化训练和评估脚本,添加原始数据支持 2025-01-15 03:48:58 +08:00
7d70d85c60
feat: 更新README和训练脚本,简化环境设置并移除不必要的代码 2025-01-13 18:26:38 +08:00
3b606da46f
Merge tag 'v0.1.2' into develop
0.1.2
2025-01-13 18:17:24 +08:00
d0e13cfbac
Merge branch 'release/0.1.2' 2025-01-13 18:16:46 +08:00
52b8952bdc
feat: 添加Gigaspeech数据集支持,更新训练脚本以使用新数据集并优化模型加载逻辑,添加Qwen2audio模型 2025-01-13 18:15:17 +08:00
e4c4a7b0a0
feat: 更新数据集名称为OCR-VQA-200K,优化训练脚本和损失计算逻辑 2025-01-11 23:59:03 +08:00
90b3181f3f
feat: 更新Python版本和依赖管理,优化训练脚本以支持Flash Attention 2 2025-01-11 03:53:23 +08:00
b766c21c9b
feat: 添加CHEM数据集支持并优化图像处理逻辑 2025-01-10 00:18:50 +08:00
8d6e5d5416
feat: 增加图像尺寸调整逻辑以支持小于28的宽高 2025-01-07 22:40:36 +08:00
7cf28e9851
Merge tag 'v0.1.1' into develop
git push -u master# Lines starting with '#' will be ignored.
2025-01-07 15:13:13 +08:00
4d65809c34
Merge branch 'release/0.1.1' 2025-01-07 15:12:53 +08:00
2cfb572bb0
Merge branch 'feature/QwenForMoreInput' into develop 2025-01-07 15:07:28 +08:00
a1bb0f7c8c
feat: 使得MOELORA支持task_id以及其他参数的传递 2025-01-07 15:07:08 +08:00
b40e0290a7
Merge branch 'master' into feature/QwenForMoreInput 2025-01-07 14:22:09 +08:00
10f532618e
Merge branch 'bugfix/ocr_dataset' into develop 2025-01-07 13:58:26 +08:00
76a9c30339
fix🐛: 更新requirements.txt中的transformers版本,移除OCRVQADataset数据集的样本限制并优化图像处理逻辑 2025-01-07 13:58:09 +08:00
0b71bfc617
feat: 重构模型库,更新数据集处理逻辑,优化导入路径,添加新的化学数据集类 2025-01-07 13:43:56 +08:00
5b09d27920
Merge branch 'feature/peft_compatible' into develop 2025-01-04 00:50:08 +08:00
6f220f17ea
format🥚: 移除不再需要的文件和示例配置,清理项目结构 2025-01-04 00:49:49 +08:00
9a06d6a237
feat: 更新评估脚本以支持新的持续学习模型配置,修正路径并增强训练过程中的模型保存逻辑 2025-01-04 00:48:31 +08:00
ce206d213c
feat: 更新PEFT库以优化MMOELORA配置,重构相关模块,增强训练脚本功能 2025-01-04 00:19:30 +08:00
ee8cc6f81d
delete debug infomation 2025-01-02 22:01:46 +08:00
f230886c3f
更新README.md以添加项目要求和代码结构,修改requirements.txt以移除不必要的依赖项 2025-01-02 21:50:39 +08:00
2062f90e5d
更新PEFT库以支持MMOELORA类型,修改训练脚本以适应新配置,增强数据集处理逻辑,添加适配器注入功能,扩展PEFT类型枚举 2025-01-02 17:48:13 +08:00
2cd1bb4993
添加PEFT库的初始化文件,更新数据集导入路径,修改训练脚本以支持新的PEFT类型和配置,新增持续学习模型配置类,添加PEFT类型枚举,更新评估和训练逻辑以适应新结构 2025-01-02 02:44:58 +08:00
aef0f6834e
添加安装脚本和依赖文件,重命名评估脚本,更新训练脚本以使用模型名称,删除临时评估文件,完成训练与测试的整体框架 2025-01-01 18:15:34 +08:00
f336496d8e
更新.gitignore以排除rsync.sh,修改TODO列表,重命名evaluate脚本,删除run.sh,添加持续学习的参数类,更新训练和评估脚本以支持新的数据集逻辑 2025-01-01 17:24:32 +08:00
f2f921113e 更新.gitignore以排除虚拟环境和缓存文件,修改TODO列表,重命名评估脚本,添加训练和评估脚本,新增数据集工厂和评估工具类 2024-12-31 17:53:16 +00:00
d6b4ec79ad 添加OCRVQADataset类及评估脚本,更新训练脚本以支持新的数据集和评估策略 2024-12-30 17:52:00 +00:00
09734720b0 添加数据集类OCRVQADataset及相关配置文件,包含训练和测试数据处理逻辑 2024-12-30 13:30:50 +00:00
5b5fcda5e5 test llama_factory 2024-12-29 10:25:38 +00:00
Yue Duan
fd4d12d88c
Initial commit 2024-12-29 14:54:14 +08:00