🔧 微调与训练
Model training, fine-tuning, and evaluation.
当前分类已收录 347 个相关项目。
Dataset Management
label-studio
多类型数据标注工具,支持图像、文本、音频等多种格式,是机器学习项目数据准备的重要工具。
- Stars: ⭐️ 27.1k
- Tags:
annotationdata-labelingmlops - 最后活动时间: 2026-04-19
datasets
Hugging Face官方数据集库,提供海量AI数据集的快速访问与处理工具,支持多种任务和框架集成。
- Stars: ⭐️ 21.4k
- Tags:
datasetshuggingfacemachine-learning - 最后活动时间: 2026-04-17
faker
强大的Python假数据生成库,可快速生成各类测试数据和合成数据集,广泛用于ML模型训练数据准备和测试场景。
- Stars: ⭐️ 19.2k
- Tags:
synthetic-datadata-generationtestingpython - 最后活动时间: 2026-04-17
cvat
业界领先的机器学习数据标注平台,支持图像和视频标注,广泛应用于计算机视觉数据集构建。
- Stars: ⭐️ 15.7k
- Tags:
AnnotationComputer VisionDatasetLabeling - 最后活动时间: 2026-04-18
easy-dataset
专为LLM微调、RAG和评估场景设计的数据集创建工具,帮助开发者高效构建高质量训练数据。
- Stars: ⭐️ 14.0k
- Tags:
数据集微调RAG - 最后活动时间: 2026-04-10
cleanlab
数据中心AI标准库,自动检测和修复数据集中的标签错误,提升模型训练质量。
- Stars: ⭐️ 11.4k
- Tags:
数据质量标签清洗数据中心AI - 最后活动时间: 2026-01-13
doccano
开源的机器学习数据标注工具,支持文本分类、序列标注等多种任务,界面友好易用。
- Stars: ⭐️ 10.6k
- Tags:
annotation-tooldata-labelingmachine-learningnlp - 最后活动时间: 2026-04-14
fiftyone
高质量数据集精炼与可视化AI模型工具,支持计算机视觉任务的数据清洗、标注和质量管理。
- Stars: ⭐️ 10.6k
- Tags:
Computer VisionData CurationVisualization - 最后活动时间: 2026-04-18
nlp_chinese_corpus
大规模中文自然语言处理语料库,包含新闻、百科、问答等多种数据集。
- Stars: ⭐️ 9.9k
- Tags:
Chinese CorpusDatasetNLP - 最后活动时间: 2026-02-06
X-AnyLabeling
AI驱动的智能数据标注工具,集成SAM等多种模型,支持目标检测、分割、OCR等任务。
- Stars: ⭐️ 8.8k
- Tags:
Data LabelingAnnotationSAMYOLO - 最后活动时间: 2026-04-18
data-juicer
面向大模型的数据处理工具,支持多模态数据清洗、转换与合成数据生成,优化预训练和指令微调流程。
- Stars: ⭐️ 6.3k
- Tags:
LLM数据处理多模态合成数据 - 最后活动时间: 2026-04-18
snorkel
基于弱监督的训练数据快速生成系统,大幅降低机器学习数据标注成本。
- Stars: ⭐️ 6.0k
- Tags:
training-datalabelingweak-supervisiondata-science - 最后活动时间: 2026-04-10
argilla
面向AI工程师和领域专家的协作平台,支持主动学习、RLHF、弱监督等多种数据标注场景,助力构建高质量数据集。
- Stars: ⭐️ 4.9k
- Tags:
数据标注RLHF主动学习 - 最后活动时间: 2026-04-13
mimesis
高性能的多语言虚假数据生成库,支持生成多种类型的合成数据,适用于AI训练数据增强和测试场景。
- Stars: ⭐️ 4.8k
- Tags:
synthetic-datadata-generationtestingpython - 最后活动时间: 2026-04-08
tensorflow-datasets
TensorFlow官方数据集库,提供开箱即用的标准化数据集,支持TensorFlow、JAX等框架。
- Stars: ⭐️ 4.6k
- Tags:
tensorflowdatasetsmachine-learningdata - 最后活动时间: 2026-03-27
llm-datasets
精选后训练数据集与工具列表,为模型微调提供高质量数据资源。
- Stars: ⭐️ 4.4k
- Tags:
数据集后训练数据资源 - 最后活动时间: 2026-03-09
img2dataset
高效图像数据集准备工具,单机20小时可处理1亿URL,支持下载、调整大小与打包,是多模态数据准备的利器。
- Stars: ⭐️ 4.4k
- Tags:
图像数据集数据准备多模态 - 最后活动时间: 2025-10-19
Chinese-Names-Corpus
中文人名语料库,包含中文姓名、姓氏、名字等数据,适用于中文分词、命名实体识别等NLP任务。
- Stars: ⭐️ 4.3k
- Tags:
nlpchinesenercorpusdataset - 最后活动时间: 2025-11-09
MNBVC
超大规模中文语料数据集,对标ChatGPT训练数据规模,涵盖新闻、小说、论文、对话等多种文本类型。
- Stars: ⭐️ 4.2k
- Tags:
中文语料数据集LLM训练 - 最后活动时间: 2026-04-06
deequ
基于Spark的数据质量测试库,为大规模机器学习数据集提供自动化质量保障。
- Stars: ⭐️ 3.6k
- Tags:
data-qualitysparkunit-testingml-pipeline - 最后活动时间: 2026-04-01
common-voice
Mozilla开源语音数据集项目,收集真实人群语音数据用于训练语音识别模型。
- Stars: ⭐️ 3.5k
- Tags:
speech-datasetopen-datavoice-recognition - 最后活动时间: 2026-04-19
anylabeling
AI辅助数据标注工具,支持YOLO、SAM系列模型自动标注,大幅提升标注效率。
- Stars: ⭐️ 3.3k
- Tags:
Data LabelingYOLOSAMSegment Anything - 最后活动时间: 2026-02-22
Waymo Open Dataset
Waymo官方开源的自动驾驶数据集,包含高质量传感器数据,是自动驾驶AI研究的标杆资源。
- Stars: ⭐️ 3.3k
- Tags:
autonomous-drivingdatasetcomputer-visionself-driving - 最后活动时间: 2026-01-08
DataFlow
基于最新LLM的数据准备工具,提供丰富的算子和流水线支持,简化数据清洗与合成流程。
- Stars: ⭐️ 3.3k
- Tags:
LLMData PipelineData Synthesis - 最后活动时间: 2026-04-15
distilabel
合成数据和AI反馈框架,帮助工程师构建快速、可靠的训练数据管道。
- Stars: ⭐️ 3.2k
- Tags:
synthetic-datarlhfrlaifdata-generationhuggingface - 最后活动时间: 2026-04-13
the_well
15TB规模的物理模拟数据集集合,涵盖流体动力学等多个物理领域,适用于科学计算AI模型训练。
- Stars: ⭐️ 3.0k
- Tags:
datasetphysics-simulationscientific-computingdeep-learning - 最后活动时间: 2026-03-25
datachain
面向多模态数据的数据分析、版本控制和ETL工具,支持视频、音频、PDF和图像等多种格式。
- Stars: ⭐️ 2.7k
- Tags:
multimodaldata-processingetlmlops - 最后活动时间: 2026-04-17
loghub
大规模系统日志数据集合,专为AI驱动的日志分析和异常检测研究设计。
- Stars: ⭐️ 2.7k
- Tags:
log-analysisanomaly-detectiondatasetsai - 最后活动时间: 2026-04-18
synthetic-data-generator
专门生成高质量结构化表格数据的框架,支持隐私保护和数据增强,基于深度学习和GAN技术提供可靠的合成数据解决方案。
- Stars: ⭐️ 2.4k
- Tags:
Synthetic DataGenerative AITabular DataPrivacy - 最后活动时间: 2026-04-13
imbalanced-dataset-sampler
PyTorch不平衡数据集采样器,通过过采样低频类别和欠采样高频类别解决数据不平衡问题。
- Stars: ⭐️ 2.3k
- Tags:
imbalanced-datadata-samplingpytorchoversampling - 最后活动时间: 2026-04-06
audiomentations
音频数据增强 Python 库,帮助音频机器学习模型适应真实世界场景。
- Stars: ⭐️ 2.3k
- Tags:
audio-augmentationdata-augmentationpython - 最后活动时间: 2026-04-13
open-thoughts
面向推理模型的全开放数据策展项目,提供高质量训练数据以提升模型推理能力。
- Stars: ⭐️ 2.2k
- Tags:
open-datareasoningdatasetllm-training - 最后活动时间: 2025-12-02
fastdup
高效的图像视频数据集分析工具,支持数据清洗、去重、异常检测等功能,大幅降低数据处理成本。
- Stars: ⭐️ 1.8k
- Tags:
Data CurationImage AnalysisOutlier Detection - 最后活动时间: 2026-04-14
Project_CodeNet
IBM开源的大规模代码数据集,包含数百万代码样本,适用于代码理解、生成和翻译等AI任务。
- Stars: ⭐️ 1.7k
- Tags:
datasetcode-aicode-generationprogram-synthesismachine-learning - 最后活动时间: 2025-12-21
curator
面向后训练和结构化数据提取的合成数据管理工具,支持高质量数据集生成。
- Stars: ⭐️ 1.7k
- Tags:
Synthetic DataFine-tuningData Curation - 最后活动时间: 2026-04-18
drawdata
在Python笔记本中通过可视化绘图方式快速创建和标注数据集,适用于机器学习训练数据的快速原型设计。
- Stars: ⭐️ 1.7k
- Tags:
datasetvisualizationpythonml-tools - 最后活动时间: 2026-01-27
DataDesigner
NVIDIA NeMo数据设计器,用于生成高质量合成数据,支持多模态数据和智能体工作流。
- Stars: ⭐️ 1.6k
- Tags:
synthetic-datanvidianemo - 最后活动时间: 2026-04-18
ydata-synthetic
用于表格和时间序列数据的合成数据生成器,支持多种GAN架构。
- Stars: ⭐️ 1.6k
- Tags:
synthetic-datagantime-seriestabular-data - 最后活动时间: 2026-04-15
AlpacaDataCleaned
经过清洗和筛选的 Stanford Alpaca 数据集,适用于指令微调和大模型训练。
- Stars: ⭐️ 1.6k
- Tags:
datasetalpacainstruction-tuning - 最后活动时间: 2026-03-07
synthetic-data-kit
高质量合成数据集生成工具,用于LLM训练和微调场景。
- Stars: ⭐️ 1.6k
- Tags:
synthetic-datallmdatasetgenerationpython - 最后活动时间: 2025-10-28
CTGAN
条件生成对抗网络,用于生成合成表格数据。
- Stars: ⭐️ 1.5k
- Tags:
ctgansynthetic-datatabular-datagan - 最后活动时间: 2026-04-13
Curator
可扩展的LLM数据预处理和管理工具包,支持数据去重、质量评估和处理流水线。
- Stars: ⭐️ 1.5k
- Tags:
data-processingllmfine-tuning - 最后活动时间: 2026-04-18
dolma
OLMo预训练数据生成与检查工具集,支持大规模数据处理流程。
- Stars: ⭐️ 1.5k
- Tags:
datasetllmdata-processingnlp - 最后活动时间: 2025-11-05
chatterbot-corpus
多语言对话语料库,为聊天机器人训练提供丰富的对话数据集,支持多种语言。
- Stars: ⭐️ 1.4k
- Tags:
DatasetDialogNLPCorpus - 最后活动时间: 2026-03-24
uco3d
罕见物体3D数据集,为3D视觉与生成模型研究提供高质量多视角数据。
- Stars: ⭐️ 1.3k
- Tags:
3d-datasetcomputer-visionmultiview - 最后活动时间: 2025-11-13
free-exercise-db
开放的公共领域运动数据集,包含800多种运动的JSON格式数据。
- Stars: ⭐️ 1.3k
- Tags:
fitnessexerciseopen-datadataset - 最后活动时间: 2026-04-05
adaptive
并行主动学习数学函数的工具库,支持自适应采样和实时可视化,适用于科学计算与机器学习优化场景。
- Stars: ⭐️ 1.2k
- Tags:
active-learningadaptive-samplingmachine-learningpython - 最后活动时间: 2026-04-18
Matterport
Matterport3D大规模室内场景RGB-D数据集,广泛应用于3D视觉与导航任务。
- Stars: ⭐️ 1.2k
- Tags:
3d-datasetrgb-dindoor-navigation - 最后活动时间: 2025-11-03
cleanvision
自动检测图像数据集中的质量问题,支持重复、模糊、过暗过亮等异常检测。
- Stars: ⭐️ 1.2k
- Tags:
Data QualityComputer VisionData Validation - 最后活动时间: 2026-01-08
torch-audiomentations
基于PyTorch的快速音频数据增强库,专为深度学习设计。支持多种音频变换和可微分数据增强,适合训练音频AI模型。
- Stars: ⭐️ 1.1k
- Tags:
audio-augmentationpytorchdeep-learningdata-augmentation - 最后活动时间: 2025-11-24
audino
开源音频标注工具,支持语音处理和机器学习数据集的高效标注工作流。
- Stars: ⭐️ 1.1k
- Tags:
音频标注数据标注语音处理 - 最后活动时间: 2026-02-03
datasets
卫星与航空影像深度学习数据集集合,支持遥感图像分析任务。
- Stars: ⭐️ 1.1k
- Tags:
satellite-imageryremote-sensingdeep-learningdataset - 最后活动时间: 2026-04-15
label-studio-ml-backend
Label Studio 机器学习后端配置与模板,支持将 ML 模型集成到数据标注工作流中,实现自动化预标注。
- Stars: ⭐️ 1.0k
- Tags:
label-studioml-backenddata-labelingannotation - 最后活动时间: 2026-04-13
GraphGen
基于知识图谱的LLM合成数据生成框架,增强监督微调效果。
- Stars: ⭐️ 1.0k
- Tags:
data-synthesisllm-trainingknowledge-graphsft - 最后活动时间: 2026-04-13
CLUECorpus2020
大规模中文预训练语料库,包含100G高质量中文文本数据,适用于BERT、RoBERTa等模型预训练。
- Stars: ⭐️ 1.0k
- Tags:
中文语料预训练NLP - 最后活动时间: 2026-02-06
semhash
快速多模态语义去重与过滤工具,支持图像和文本数据集的高效清洗。
- Stars: ⭐️ 910
- Tags:
语义去重数据清洗多模态 - 最后活动时间: 2026-01-20
PlantVillage-Dataset
植物病害叶片图像数据集,广泛用于农业AI和植物病害识别研究。
- Stars: ⭐️ 862
- Tags:
image-classificationdatasetagricultureplant-disease - 最后活动时间: 2026-02-05
deepfabric
一站式合成数据生成与模型训练评估流水线,支持高质量数据生成、训练和评测全流程。
- Stars: ⭐️ 856
- Tags:
Synthetic DataFine-tuningEvaluationDataset - 最后活动时间: 2026-04-13
tatoeba2
协作式开放句子翻译数据集平台,为NLP和机器翻译提供高质量多语言训练数据。
- Stars: ⭐️ 847
- Tags:
translationnlpdatasetmultilingual - 最后活动时间: 2026-04-02
annotorious
轻量级JavaScript图像标注库,可快速为任何网页添加图像标注功能,支持IIIF和OpenSeadragon集成。
- Stars: ⭐️ 830
- Tags:
annotationimage-annotationjavascriptiiif - 最后活动时间: 2026-03-27
croissant
ML数据集的高层标准格式,整合元数据、资源、结构和语义四层信息,简化数据集发布与消费流程。
- Stars: ⭐️ 816
- Tags:
数据集格式标准化ML - 最后活动时间: 2026-04-17
Image-Harmonization-Dataset-iHarmony4
CVPR 2020首个大规模图像协调基准数据集,用于图像合成与协调研究。
- Stars: ⭐️ 805
- Tags:
image-harmonizationcomputer-visiondatasetimage-composition - 最后活动时间: 2026-02-24
libact
Python池化主动学习库,提供多种不确定性采样策略,帮助高效选择标注样本以降低标注成本。
- Stars: ⭐️ 792
- Tags:
active-learningmachine-learninguncertainty-samplingpython - 最后活动时间: 2026-04-08
data-validation
机器学习数据探索与验证库,帮助确保训练数据质量。
- Stars: ⭐️ 779
- Tags:
data-validationmachine-learningdata-quality - 最后活动时间: 2026-03-23
labelCloud
轻量级3D点云标注工具,支持3D边界框标注,适用于自动驾驶和机器人视觉的数据准备。
- Stars: ⭐️ 776
- Tags:
3D标注点云计算机视觉 - 最后活动时间: 2025-11-09
awesome-chatgpt-dataset
精选ChatGPT训练数据集合集,助力训练自定义大语言模型。
- Stars: ⭐️ 764
- Tags:
datasetchatgptgpt4llm-training - 最后活动时间: 2025-10-20
efaqa-corpus-zh
心理咨询问答中文语料库,适用于聊天机器人和情感分析研究。
- Stars: ⭐️ 747
- Tags:
corpusnlppsychologychatbot - 最后活动时间: 2026-03-06
balance
用于处理偏差数据样本的Python库,提供简洁的工作流程和方法,帮助从偏差样本推断目标总体。
- Stars: ⭐️ 741
- Tags:
data-balancingbias-correctionstatisticsdata-science - 最后活动时间: 2026-04-18
anndata
用于单细胞分析和生物信息学的带注释数据结构库,支持机器学习工作流。
- Stars: ⭐️ 732
- Tags:
anndatabioinformaticsmachine-learningdata-science - 最后活动时间: 2026-04-16
OpenML
开放机器学习平台,提供数据集共享、实验协作和开放科学工作流。
- Stars: ⭐️ 731
- Tags:
开放科学数据集共享协作平台 - 最后活动时间: 2026-01-23
Genshin_Datasets
原神角色语音数据集,适用于语音转换、歌声合成和文本转语音训练。
- Stars: ⭐️ 721
- Tags:
voice-datasetttssvcsvs - 最后活动时间: 2026-01-11
grain
专为机器学习设计的高效数据加载库,支持JAX等框架的大规模训练数据处理。
- Stars: ⭐️ 715
- Tags:
machine-learningdata-loadingjaxpython - 最后活动时间: 2026-04-17
nimble
专为大规模机器学习训练设计的列式数据存储格式,支持高效压缩和快速读取训练数据集。
- Stars: ⭐️ 707
- Tags:
columnarmachine-learningml-trainingfile-format - 最后活动时间: 2026-04-17
lightly-studio
计算机视觉数据管理工具,支持图像标注、数据筛选和MLOps工作流集成。
- Stars: ⭐️ 691
- Tags:
computer-visionimage-labelingmlops - 最后活动时间: 2026-04-17
comma10k
包含1万张众包标注图像的语义分割数据集,专为训练分割网络设计。
- Stars: ⭐️ 689
- Tags:
DatasetSegmentationComputer VisionTraining Data - 最后活动时间: 2026-02-20
INCEpTION
语义标注平台,提供智能标注辅助和知识管理功能,支持主动学习和实体链接。
- Stars: ⭐️ 689
- Tags:
annotation-toolactive-learningmachine-learningknowledge-base - 最后活动时间: 2026-04-18
datumaro
计算机视觉数据集管理框架,支持多种格式转换、数据分析和数据集构建。
- Stars: ⭐️ 665
- Tags:
datasetcomputer-visiondata-management - 最后活动时间: 2026-04-16
synthcity
用于生成和评估合成表格数据的库,支持隐私保护、公平性增强和数据增强场景。
- Stars: ⭐️ 654
- Tags:
synthetic-datadata-augmentationprivacyfairnesstabular-data - 最后活动时间: 2026-04-13
datasets
网络科学与机器学习研究的数据集集合,涵盖图神经网络基准、节点分类、链接预测等任务。
- Stars: ⭐️ 652
- Tags:
datasetgraph-neural-networkbenchmark - 最后活动时间: 2025-12-20
faker
Go语言高性能假数据生成器,零依赖,可用于AI模型训练数据增强和测试数据生成。
- Stars: ⭐️ 646
- Tags:
fakerdata-generatorsynthetic-datago - 最后活动时间: 2026-04-16
NAS-Bench-201
神经架构搜索基准测试API,为AutoML和NAS研究提供标准化的评估框架。
- Stars: ⭐️ 643
- Tags:
automlnasbenchmarkpytorch - 最后活动时间: 2025-10-31
Copulas
使用Copula模型生成多变量合成数据的Python库,适用于表格数据的生成式建模。
- Stars: ⭐️ 641
- Tags:
synthetic-datagenerative-modeltabular-data - 最后活动时间: 2026-04-13
datalad
基于Git和git-annex的数据版本控制工具,支持代码、数据和容器化管理,适用于AI数据集版本追踪。
- Stars: ⭐️ 636
- Tags:
data-managementversion-controlgit-annexdataset - 最后活动时间: 2026-04-18
Exclusively-Dark-Image-Dataset
专门针对低光照环境的图像数据集,包含10种不同光照条件下的标注图像,适合暗光视觉任务。
- Stars: ⭐️ 625
- Tags:
low-lightdatasetcomputer-visionobject-detection - 最后活动时间: 2026-02-13
Dataset
大规模3D视觉数据集,支持新视角合成与三维重建研究。
- Stars: ⭐️ 602
- Tags:
3d-datasetnovel-view-synthesisdeep-learning - 最后活动时间: 2026-02-10
seqio
Google开源的序列模型数据处理框架,提供任务驱动的数据集管理、预处理和评估流程。
- Stars: ⭐️ 593
- Tags:
sequence-modelsdatasetpreprocessingevaluation - 最后活动时间: 2026-03-27
semi-auto-image-annotation-tool
基于预训练模型的半自动图像标注工具,支持80种目标类别的自动标注建议。
- Stars: ⭐️ 590
- Tags:
image-annotationdeep-learningtensorflowkeras - 最后活动时间: 2026-04-18
lost
基于Web的智能图像标注框架,支持自定义标注流程,提升数据标注效率。
- Stars: ⭐️ 576
- Tags:
Image AnnotationLabeling ToolComputer Vision - 最后活动时间: 2026-04-15
VQASynth
多模态数据集合成工具,支持场景重建和空间推理的合成数据生成,适用于构建高质量视觉问答训练数据。
- Stars: ⭐️ 558
- Tags:
DatasetMultimodalSyntheticVQA - 最后活动时间: 2026-01-05
Histopathology-Datasets
组织病理学数据集资源汇总,为医学图像分析和机器学习研究提供高质量数据集参考。
- Stars: ⭐️ 541
- Tags:
histopathologydatasetsmachine-learningmedical-imaging - 最后活动时间: 2026-03-06
SpatialVID
CVPR 2026大规模视频数据集,提供丰富空间标注,支持视频生成与3D重建研究。
- Stars: ⭐️ 540
- Tags:
video-dataset3d-reconstructionspatial-intelligencecvpr - 最后活动时间: 2026-04-14
LoveDA
NeurIPS 2021遥感土地覆盖数据集,支持域自适应语义分割,适用于遥感图像分析研究。
- Stars: ⭐️ 532
- Tags:
remote-sensingsemantic-segmentationdomain-adaptationdataset - 最后活动时间: 2026-01-21
apricot
基于子模优化的数据集子集选择工具,用于加速大规模机器学习模型训练。
- Stars: ⭐️ 529
- Tags:
machine-learningdata-sciencesubmodular-optimizationpython - 最后活动时间: 2025-11-17
datasets
NCBI官方基因组数据获取工具,为生物信息学和AI基因组研究提供标准化数据接口。
- Stars: ⭐️ 527
- Tags:
genomicsbiotechdatasetbioinformatics - 最后活动时间: 2026-04-06
Stylized-ImageNet
ICLR 2019 Oral论文,创建风格化ImageNet数据集,研究形状与纹理偏置。
- Stars: ⭐️ 525
- Tags:
imagenetstyle-transferdataseticlr2019 - 最后活动时间: 2026-04-14
entwine
专为海量点云数据设计的组织与索引工具,支持高效的数据流式传输与管理。
- Stars: ⭐️ 513
- Tags:
point-cloudlidardata-management3d-data - 最后活动时间: 2025-10-23
Minari
离线强化学习数据集标准格式,提供常用参考数据集和实用工具。
- Stars: ⭐️ 508
- Tags:
离线RL强化学习数据集格式 - 最后活动时间: 2026-01-10
Evaluation Metrics
shap
基于博弈论的机器学习模型解释框架,可视化特征重要性。
- Stars: ⭐️ 25.3k
- Tags:
machine-learningexplainabilityinterpretabilityshap - 最后活动时间: 2026-04-18
evals
OpenAI开源的LLM评估框架,提供完整的基准测试注册表和评估工具链,帮助开发者系统化地衡量大模型性能。
- Stars: ⭐️ 18.2k
- Tags:
LLM EvaluationBenchmarksOpenAI - 最后活动时间: 2026-04-14
deepeval
LLM评估框架,提供全面的模型评估指标和工具,帮助开发者系统化测试和优化大语言模型。
- Stars: ⭐️ 14.9k
- Tags:
evaluationllmtestingmetrics - 最后活动时间: 2026-04-16
ragas
专业的LLM应用评估框架,提供多种评估指标和自动化测试流程,帮助开发者快速测试和优化大语言模型应用性能。
- Stars: ⭐️ 13.5k
- Tags:
LLM评估自动化测试LLMOps - 最后活动时间: 2026-02-24
lm-evaluation-harness
大语言模型少样本评估框架,支持多种基准测试和任务类型,是LLM性能评估的行业标准工具。
- Stars: ⭐️ 12.2k
- Tags:
evaluation-frameworklanguage-modelllm-evaluation - 最后活动时间: 2026-04-08
evidently
开源ML和LLM可观测性框架,提供100+指标和可视化报告,用于评估、测试和监控AI系统。
- Stars: ⭐️ 7.4k
- Tags:
ML监控LLM可观测性模型评估 - 最后活动时间: 2026-03-30
opencompass
大模型评测平台,支持Llama3、GPT-4等主流模型在100+数据集上的全面评估,助力科学衡量大语言模型性能。
- Stars: ⭐️ 6.9k
- Tags:
LLM评估基准测试 - 最后活动时间: 2026-04-16
chinese-llm-benchmark
中文大模型能力评测平台,涵盖359个商用及开源模型,提供排行榜和超200万条缺陷库。
- Stars: ⭐️ 5.9k
- Tags:
LLM评测基准测试中文模型 - 最后活动时间: 2026-04-18
giskard-oss
开源的LLM智能体评估与测试框架,支持AI安全红队测试、公平性评估和模型验证,帮助开发者构建更可靠的AI系统。
- Stars: ⭐️ 5.3k
- Tags:
LLM评估AI安全红队测试 - 最后活动时间: 2026-04-17
Object-Detection-Metrics
目标检测算法评估指标集合,涵盖mAP、Precision-Recall等常用评估方法。
- Stars: ⭐️ 5.1k
- Tags:
MetricsEvaluationObject Detection - 最后活动时间: 2026-04-16
Kiln
一站式AI系统构建、评估与优化平台,支持RAG、智能体、微调、合成数据生成、数据集管理和MCP协议。
- Stars: ⭐️ 4.8k
- Tags:
EvaluationFine-tuningRAGMCPSynthetic Data - 最后活动时间: 2026-04-18
SWE-bench
评估大语言模型解决真实GitHub问题能力的基准测试集,是代码生成领域的重要评测标准。
- Stars: ⭐️ 4.7k
- Tags:
benchmarklanguage-modelsoftware-engineeringcode-generationllm-evaluation - 最后活动时间: 2026-04-01
VLMEvalKit
开源的大型多模态模型评估工具包,支持220+多模态模型和80+评测基准,覆盖GPT-4V、Gemini等主流模型。
- Stars: ⭐️ 4.1k
- Tags:
EvaluationMultimodalBenchmarkLMM - 最后活动时间: 2026-04-10
lmms-eval
一站式多模态评估工具包,支持文本、图像、视频、音频等多模态任务的统一评测。
- Stars: ⭐️ 4.0k
- Tags:
multimodalevaluationllm-evaluationvision-language-modelbenchmark - 最后活动时间: 2026-04-15
deepchecks
ML模型和数据持续验证测试框架,从研究到生产全流程质量保障。
- Stars: ⭐️ 4.0k
- Tags:
model-validationdata-validationmlopsmachine-learning - 最后活动时间: 2025-12-28
SwanLab
开源AI训练跟踪与可视化工具,支持云端和本地部署。可与PyTorch、Transformers等主流框架无缝集成。
- Stars: ⭐️ 3.8k
- Tags:
MLOpsVisualizationTraining Tracking - 最后活动时间: 2026-04-18
SuperCLUE
中文通用大模型综合评测基准,提供全面的中文LLM能力评估体系。
- Stars: ⭐️ 3.3k
- Tags:
BenchmarkChinese LLMEvaluation - 最后活动时间: 2026-02-06
trulens
LLM实验和AI智能体的评估与追踪工具,帮助开发者衡量和优化模型表现。
- Stars: ⭐️ 3.3k
- Tags:
EvaluationLLMAgentsObservability - 最后活动时间: 2026-04-17
mteb
大规模文本嵌入基准测试平台,涵盖分类、聚类、检索等15+任务的全面评估框架。
- Stars: ⭐️ 3.2k
- Tags:
text-embeddingbenchmarknlpinformation-retrieval - 最后活动时间: 2026-04-18
langwatch
专注于LLM评估和AI智能体测试的平台,提供可观测性和低代码功能,帮助开发者优化和监控大语言模型应用。
- Stars: ⭐️ 3.2k
- Tags:
LLM评估智能体测试可观测性 - 最后活动时间: 2026-04-18
hallucination-leaderboard
LLM幻觉评估排行榜,对比主流大模型在文档摘要任务中的幻觉频率,帮助开发者选择更可靠的模型。
- Stars: ⭐️ 3.2k
- Tags:
hallucinationllm-evaluationbenchmark - 最后活动时间: 2026-04-17
helm
斯坦福CRFM开源的大模型评估框架,支持LLM和多模态模型的全面、可复现、透明评估。
- Stars: ⭐️ 2.8k
- Tags:
模型评估LLM多模态 - 最后活动时间: 2026-04-16
evalscope
轻量高效的大模型评估框架,支持LLM、VLM、AIGC模型的性能基准测试。
- Stars: ⭐️ 2.7k
- Tags:
模型评估基准测试LLM - 最后活动时间: 2026-04-17
alibi-detect
异常值检测、对抗样本检测和数据漂移检测算法库,支持图像、文本、时序数据。
- Stars: ⭐️ 2.5k
- Tags:
anomaly-detectiondrift-detectionoutlier-detectionmachine-learning - 最后活动时间: 2025-12-11
evaluate
HuggingFace官方评估库,提供便捷的机器学习模型与数据集评估工具。
- Stars: ⭐️ 2.4k
- Tags:
evaluationmachine-learninghuggingface - 最后活动时间: 2026-04-17
torchmetrics
PyTorch分布式机器学习评估指标库,支持多种深度学习指标。
- Stars: ⭐️ 2.4k
- Tags:
metricspytorchdeep-learningmachine-learning - 最后活动时间: 2026-04-13
lighteval
HuggingFace出品的LLM全栈评估工具包,支持多后端模型评估与丰富的评估指标。
- Stars: ⭐️ 2.4k
- Tags:
LLM评估HuggingFace评估框架 - 最后活动时间: 2026-04-17
EvalAI
开源AI模型评估平台,支持创建AI挑战赛和排行榜,推动可复现研究。
- Stars: ⭐️ 2.0k
- Tags:
EvaluationBenchmarkLeaderboard - 最后活动时间: 2026-04-13
terminal-bench
评估大语言模型在终端复杂任务中表现的基准测试框架。
- Stars: ⭐️ 2.0k
- Tags:
BenchmarkLLM EvaluationTerminal - 最后活动时间: 2026-01-22
inspect_ai
专为大语言模型评估设计的开源框架,支持多种评测任务。
- Stars: ⭐️ 1.9k
- Tags:
llm-evaluationbenchmarkframework - 最后活动时间: 2026-04-17
training
MLPerf训练基准参考实现,提供机器学习模型训练性能的标准化评估。
- Stars: ⭐️ 1.8k
- Tags:
mlperfbenchmarkmachine-learningtraining - 最后活动时间: 2026-04-16
BasicTS
公平可扩展的时间序列预测基准测试工具包,支持多种预测模型评估。
- Stars: ⭐️ 1.8k
- Tags:
time-seriesforecastingbenchmarkdeep-learning - 最后活动时间: 2025-12-23
WeightWatcher
深度神经网络准确性预测工具,无需测试数据即可评估模型质量和泛化能力。
- Stars: ⭐️ 1.7k
- Tags:
deep-learningmodel-evaluationneural-networkaccuracy-prediction - 最后活动时间: 2026-04-14
ImageReward
NeurIPS 2023论文项目,学习并评估文本生成图像的人类偏好,通过RLHF训练奖励模型。
- Stars: ⭐️ 1.7k
- Tags:
text-to-imagehuman-preferencesrlhf - 最后活动时间: 2025-10-29
VBench
CVPR2024 Highlight视频生成评估基准工具,提供全面的视频生成质量评测方案。学术级权威评测框架。
- Stars: ⭐️ 1.6k
- Tags:
Video GenerationBenchmarkEvaluation - 最后活动时间: 2026-03-23
imodels
可解释机器学习Python包,提供简洁透明的预测建模工具,兼容sklearn生态。
- Stars: ⭐️ 1.6k
- Tags:
explainable-aimachine-learninginterpretabilityscikit-learnrule-learning - 最后活动时间: 2026-04-13
bsuite
强化学习智能体核心能力评估实验集合,提供精心设计的RL基准测试框架。
- Stars: ⭐️ 1.5k
- Tags:
reinforcement-learningbenchmarkevaluationrl-agent - 最后活动时间: 2026-03-30
RULER
用于评估长上下文语言模型真实上下文窗口大小的基准测试工具。
- Stars: ⭐️ 1.5k
- Tags:
benchmarklong-contextllm-evaluation - 最后活动时间: 2025-11-13
pycm
多分类混淆矩阵Python库,提供全面的模型评估指标和统计分析功能。
- Stars: ⭐️ 1.5k
- Tags:
confusion-matrixmachine-learningevaluation - 最后活动时间: 2026-04-18
bullshit-benchmark
评估AI模型是否能识别并质疑无意义提示词的基准测试,测试模型的真实理解能力。
- Stars: ⭐️ 1.5k
- Tags:
llm-evaluationbenchmarkai-safetymodel-evaluation - 最后活动时间: 2026-04-18
mle-bench
衡量AI智能体在机器学习工程任务上表现的基准测试平台。
- Stars: ⭐️ 1.5k
- Tags:
benchmarkml-engineeringai-agentsevaluation - 最后活动时间: 2026-03-20
evalite
TypeScript LLM 应用评估框架,帮助测试和优化 AI 应用性能。
- Stars: ⭐️ 1.5k
- Tags:
aievalstypescriptllm - 最后活动时间: 2026-03-27
sacrebleu
机器翻译评估的标准BLEU指标参考实现,自动下载测试数据集并生成版本号便于跨实验室对比实验结果。
- Stars: ⭐️ 1.2k
- Tags:
nlpmachine-translationevaluationbleumetrics - 最后活动时间: 2026-01-12
torch-fidelity
PyTorch生成模型的高保真性能评估指标库,支持FID、IS、KID等主流指标计算。
- Stars: ⭐️ 1.2k
- Tags:
生成模型评估指标PyTorch - 最后活动时间: 2026-02-17
frontier-evals
OpenAI官方的前沿模型评估框架,用于评估和测试先进AI模型的能力与安全性。
- Stars: ⭐️ 1.2k
- Tags:
evaluationopenaillm-evaluationmodel-safety - 最后活动时间: 2026-04-16
AICGSecEval
腾讯悟空代码安全团队开发的AI生成代码安全评估基准,用于评估代码安全性。
- Stars: ⭐️ 1.2k
- Tags:
BenchmarkCode SecurityAIGC - 最后活动时间: 2026-04-15
procgen
OpenAI开发的强化学习基准测试环境,提供程序化生成的类游戏环境用于评估AI泛化能力。
- Stars: ⭐️ 1.2k
- Tags:
reinforcement-learningbenchmarkgym-environmentsprocgen - 最后活动时间: 2026-03-27
uqlm
语言模型不确定性量化Python包,用于基于UQ的LLM幻觉检测和置信度评估。
- Stars: ⭐️ 1.1k
- Tags:
Hallucination DetectionAI SafetyLLM Evaluation - 最后活动时间: 2026-04-16
performance
R语言模型性能评估包,提供R2、ICC、LOO、AIC、BF等多种统计指标计算。
- Stars: ⭐️ 1.1k
- Tags:
statisticsmodel-evaluationr-packagemetrics - 最后活动时间: 2026-04-13
LiveBench
具有挑战性的无污染LLM基准测试,提供真实可靠的模型能力评估。
- Stars: ⭐️ 1.1k
- Tags:
基准测试LLM评估无污染 - 最后活动时间: 2026-04-17
Local-LLM-Comparison-Colab-UI
在Colab中比较不同本地可部署LLM性能的WebUI工具,帮助用户选择最适合消费级硬件的模型。
- Stars: ⭐️ 1.1k
- Tags:
llmbenchmarkcolablocal-llm - 最后活动时间: 2026-01-13
atropos
LLM强化学习环境框架,用于收集和评估大语言模型在多样化环境中的轨迹数据。
- Stars: ⭐️ 1.1k
- Tags:
RLLLM EvaluationFramework - 最后活动时间: 2026-04-13
OpenOOD
用于基准测试通用分布外检测的综合工具库,支持多种OOD检测方法的评估与比较。
- Stars: ⭐️ 1.0k
- Tags:
OOD DetectionBenchmarkAnomaly Detection - 最后活动时间: 2025-12-01
tau2-bench
双控环境下的对话智能体评估基准,用于测试和衡量AI代理的对话能力。
- Stars: ⭐️ 1.0k
- Tags:
BenchmarkEvaluationAgents - 最后活动时间: 2026-04-17
openevals
开箱即用的LLM应用评估工具集,帮助开发者快速评估模型性能和应用质量。
- Stars: ⭐️ 1.0k
- Tags:
EvaluationLLMTesting - 最后活动时间: 2026-04-16
rogue
AI智能体评估与红队测试平台,用于测试和评估AI Agent的安全性和性能表现。
- Stars: ⭐️ 1.0k
- Tags:
Agent TestingRed TeamE2E Testing - 最后活动时间: 2026-03-17
judgeval
开源AI智能体评估与监控平台,支持强化学习和监督微调,提供环境数据收集和评估工具。
- Stars: ⭐️ 1.0k
- Tags:
Agent EvaluationRLObservability - 最后活动时间: 2026-04-13
skill
PinchBench基准测试系统,评估LLM模型作为编码智能体的表现。
- Stars: ⭐️ 1.0k
- Tags:
benchmarkllm-evaluationcoding-agents - 最后活动时间: 2026-04-15
genai-compliance-bench
面向监管行业的生成式AI合规评估基准,用于评估GenAI在受监管场景下的表现与合规性。
- Stars: ⭐️ 1.0k
- Tags:
genaicompliancebenchmarkevaluationllm-evaluation - 最后活动时间: 2026-03-27
The-Little-Book-of-ML-Metrics
机器学习评估指标参考手册,涵盖分类、回归、聚类等指标。
- Stars: ⭐️ 999
- Tags:
metricsmachine-learningevaluationbook - 最后活动时间: 2026-03-18
factorio-learning-environment
基于Factorio游戏的开放式LLM评估环境,用于测试大语言模型在复杂任务规划与自动化场景中的能力表现。
- Stars: ⭐️ 959
- Tags:
llm-evaluationbenchmarkagent-evaluationfactorio - 最后活动时间: 2026-04-07
KernelBench
测试LLM能否编写GPU Kernel的基准测试工具,支持Torch到CUDA的代码生成评估。
- Stars: ⭐️ 935
- Tags:
GPU代码生成基准测试 - 最后活动时间: 2026-03-24
ollama-grid-search
一款跨平台桌面应用,用于评估和比较本地LLM模型性能,支持网格搜索和A/B测试,帮助开发者选择最优模型配置。
- Stars: ⭐️ 927
- Tags:
llmollamagrid-searchevaluationrust - 最后活动时间: 2026-04-07
jiwer
语音识别系统评估工具,提供词错误率(WER)等相似度度量指标,用于评估和优化语音转文本系统性能。
- Stars: ⭐️ 879
- Tags:
speech-to-textevaluation-metricswerasr - 最后活动时间: 2026-04-16
autoevals
快速评估AI模型输出的工具,采用行业最佳实践帮助开发者轻松完成模型评测。
- Stars: ⭐️ 864
- Tags:
ai-evaluationllmmodel-evaluationtesting - 最后活动时间: 2026-04-03
TALENT
表格数据学习综合工具包与基准,包含35+深度学习方法、10+经典方法和300+数据集。
- Stars: ⭐️ 840
- Tags:
tabular-datadeep-learningbenchmarkmachine-learning - 最后活动时间: 2026-04-10
CLIP_benchmark
用于评估CLIP类视觉-语言模型的基准测试工具,支持多种评估任务和数据集。
- Stars: ⭐️ 813
- Tags:
clipvision-languageevaluationbenchmarkmultimodal - 最后活动时间: 2026-03-19
ISC-Bench
前沿大模型内部安全崩溃基准测试,包含56个TVD模板,用于评估AI安全性和红队攻击测试。
- Stars: ⭐️ 801
- Tags:
ai-safetybenchmarkllm-safetyred-teamingjailbreak - 最后活动时间: 2026-04-17
Spider2
ICLR 2025 Oral 论文,评估语言模型在企业级 Text-to-SQL 工作流中的表现。
- Stars: ⭐️ 783
- Tags:
text-to-sqlbenchmarkllm-evaluation - 最后活动时间: 2026-01-30
robustbench
NeurIPS 2021标准化对抗鲁棒性基准测试平台,提供模型鲁棒性评估工具。
- Stars: ⭐️ 772
- Tags:
adversarial-robustnessbenchmarkmachine-learningsecurity - 最后活动时间: 2026-04-14
Video-MME
CVPR 2025首个多模态大语言模型视频分析综合评估基准。
- Stars: ⭐️ 759
- Tags:
video-benchmarkmultimodal-evaluationvideo-understandingmme - 最后活动时间: 2025-12-08
aequitas
机器学习偏见审计与公平性工具包,用于检测和缓解算法偏见。
- Stars: ⭐️ 758
- Tags:
bias-detectionfairnessml-auditresponsible-ai - 最后活动时间: 2026-02-03
COMET
基于神经网络的机器翻译评估框架,提供高质量MT评价指标。
- Stars: ⭐️ 739
- Tags:
machine-translationevaluation-metricsnlpneural-network - 最后活动时间: 2026-03-27
web-codegen-scorer
用于评估LLM生成Web代码质量的工具,帮助衡量大模型在代码生成任务上的表现。
- Stars: ⭐️ 714
- Tags:
LLMEvaluationCode Generation - 最后活动时间: 2026-04-03
LongMemEval
评估聊天助手长期交互记忆能力的基准测试,发表于ICLR 2025。
- Stars: ⭐️ 685
- Tags:
llmbenchmarklong-term-memoryevaluationchat-assistant - 最后活动时间: 2025-10-24
long-form-factuality
大语言模型长文本事实性评估基准,提供论文原始代码用于评测LLM生成内容的事实准确性。
- Stars: ⭐️ 680
- Tags:
llmbenchmarkfactualityevaluation - 最后活动时间: 2026-04-18
dingo
全面的AI数据、模型和应用质量评估工具,支持LLM幻觉检测和数据质量评估。
- Stars: ⭐️ 679
- Tags:
LLM评估数据质量幻觉检测 - 最后活动时间: 2026-04-17
image-similarity-measures
实现了8种图像相似度评估指标,包括RMSE、PSNR、SSIM、FSIM等,适用于机器学习图像处理任务的评估。
- Stars: ⭐️ 642
- Tags:
Image ProcessingEvaluation MetricsMachine Learning - 最后活动时间: 2026-04-08
skore
机器学习模型开发加速库,提供自动化评估报告、方法论指导和交叉验证分析,帮助数据科学家追踪和优化模型。
- Stars: ⭐️ 632
- Tags:
ML评估数据科学Python - 最后活动时间: 2026-04-17
benchmark
OCR光学字符识别模型基准测试工具,用于评估不同OCR引擎的性能表现。
- Stars: ⭐️ 632
- Tags:
ocrbenchmarkcomputer-visiontext-recognition - 最后活动时间: 2025-10-21
neptune-client
专为基础模型训练设计的实验追踪工具,支持MLOps全流程监控。
- Stars: ⭐️ 622
- Tags:
MLOpsExperiment TrackingLLM - 最后活动时间: 2026-03-17
weatherbench2
下一代数据驱动全球天气预报模型的基准测试平台,用于评估和比较AI气象预测模型的性能。
- Stars: ⭐️ 602
- Tags:
weather-forecastingbenchmarkmachine-learningdata-driven - 最后活动时间: 2026-04-16
marginaleffects
R语言统计分析包,支持100多种统计和ML模型的预测、边际效应计算与可视化,提供多种不确定性估计方法。
- Stars: ⭐️ 601
- Tags:
rstatisticsmachine-learningevaluationinterpretability - 最后活动时间: 2026-04-17
evalchemy
LLM自动评估工具,提供全面的模型性能测试和基准评测能力。
- Stars: ⭐️ 589
- Tags:
llmevaluationbenchmark - 最后活动时间: 2026-02-24
common_metrics_on_video_quality
视频质量评估工具,支持FVD、PSNR、SSIM、LPIPS等主流指标,适用于生成视频和预测视频的质量评价。
- Stars: ⭐️ 569
- Tags:
video-qualitymetricsfvdpsnrssim - 最后活动时间: 2026-01-17
LettuceDetect
轻量级RAG幻觉检测框架,基于BERT实现高效的幻觉评估与检测。
- Stars: ⭐️ 563
- Tags:
hallucination-detectionbertnlprag-evaluation - 最后活动时间: 2026-03-06
MMMU
面向专家级AGI的多学科多模态理解与推理基准测试,涵盖广泛的STEM领域。
- Stars: ⭐️ 559
- Tags:
多模态基准测试AGI - 最后活动时间: 2026-02-12
langtest
大语言模型测试与评估工具包,确保AI模型安全有效部署。
- Stars: ⭐️ 555
- Tags:
LLM测试AI安全模型评估 - 最后活动时间: 2026-04-15
OpenJudge
一个统一的大语言模型评估框架,提供全面的质量评估和奖励模型功能,支持RLHF对齐训练。
- Stars: ⭐️ 554
- Tags:
llmevaluationreward-modelrlhfalignment - 最后活动时间: 2026-04-17
agentevals
开箱即用的智能体轨迹评估工具,帮助开发者评估和优化 AI 智能体的表现。
- Stars: ⭐️ 551
- Tags:
agentevaluationtestingllm - 最后活动时间: 2026-04-16
open-unlearning
一站式LLM遗忘学习仓库,NeurIPS D&B '25收录,涵盖基准测试、隐私保护和成员推理攻击等研究方向。
- Stars: ⭐️ 524
- Tags:
UnlearningPrivacyBenchmarks - 最后活动时间: 2026-03-18
Fine-tuning Tools
LlamaFactory
统一高效的LLM/VLM微调框架,ACL 2024论文项目,支持100+模型和LoRA/QLoRA/量化等完整微调方案。
- Stars: ⭐️ 70.3k
- Tags:
Fine-tuningLoRALLM - 最后活动时间: 2026-04-12
unsloth
统一的本地模型训练与运行Web UI,支持Qwen、DeepSeek、Gemma等主流开源模型。
- Stars: ⭐️ 62.1k
- Tags:
Fine-tuningLLMTraining - 最后活动时间: 2026-04-19
DeepSpeed
微软开源深度学习优化库,支持千亿级参数模型训练,提供零冗余优化器和混合并行等核心技术。
- Stars: ⭐️ 42.1k
- Tags:
分布式训练深度学习PyTorch - 最后活动时间: 2026-04-17
self-llm
开源大模型食用指南,提供基于Linux环境的LLM/MLLM快速微调(全参数/LoRA)与部署教程,覆盖LLaMA、Qwen、ChatGLM等主流模型。
- Stars: ⭐️ 29.9k
- Tags:
LLM微调部署教程LoRA - 最后活动时间: 2026-04-13
peft
Hugging Face官方的参数高效微调库,支持LoRA、Prefix Tuning等前沿方法,大幅降低大模型微调的显存需求。
- Stars: ⭐️ 21.0k
- Tags:
Fine-tuningLoRAPEFTTransformers - 最后活动时间: 2026-04-17
verl
火山引擎推出的LLM强化学习框架,用于大语言模型的训练和优化。
- Stars: ⭐️ 20.8k
- Tags:
reinforcement-learningllmtraining - 最后活动时间: 2026-04-17
trl
Hugging Face推出的强化学习训练库,支持RLHF、PPO等算法,让大模型对齐训练简单高效。
- Stars: ⭐️ 18.1k
- Tags:
RLHFPPO强化学习 - 最后活动时间: 2026-04-18
WeClone
从聊天记录创建AI数字分身的一站式解决方案,通过微调大语言模型精准捕捉个人说话风格。
- Stars: ⭐️ 17.6k
- Tags:
数字分身LLM微调聊天机器人 - 最后活动时间: 2026-04-14
Megatron-LM
NVIDIA开源的大规模Transformer模型训练框架,支持模型并行、张量并行和流水线并行等分布式训练技术。
- Stars: ⭐️ 16.1k
- Tags:
分布式训练TransformerNVIDIA - 最后活动时间: 2026-04-19
optuna
强大的超参数优化框架,支持分布式和并行优化,广泛应用于机器学习模型调参。
- Stars: ⭐️ 14.0k
- Tags:
hyperparameter-optimizationmachine-learningauto-mloptimization - 最后活动时间: 2026-04-17
ms-swift
ModelScope官方训练框架,支持PEFT和全参数微调600+大语言模型及300+多模态模型,涵盖SFT/DPO/GRPO等多种训练范式。
- Stars: ⭐️ 13.8k
- Tags:
LLM训练PEFT多模态 - 最后活动时间: 2026-04-18
litgpt
基于Lightning AI构建的完整LLM开发工具链,支持20+高性能模型的预训练、微调与大规模部署。
- Stars: ⭐️ 13.3k
- Tags:
LLM模型训练微调 - 最后活动时间: 2026-04-16
TinyZero
DeepSeek R1-Zero的极简复现版本,帮助开发者快速理解和实验强化学习训练方法。
- Stars: ⭐️ 13.1k
- Tags:
DeepSeekR1-Zero强化学习 - 最后活动时间: 2026-02-27
PaddleNLP
飞桨生态下的易用高效大语言模型库,提供丰富的预训练模型和全流程NLP开发能力。
- Stars: ⭐️ 12.9k
- Tags:
NLPLLM预训练模型 - 最后活动时间: 2025-12-17
axolotl
流行的LLM微调框架,支持多种模型架构和训练方法,简化大模型微调流程。
- Stars: ⭐️ 11.7k
- Tags:
Fine-tuningLLM - 最后活动时间: 2026-04-19
ai-toolkit
强大的扩散模型微调训练工具包,支持多种模型架构的训练和优化。
- Stars: ⭐️ 10.3k
- Tags:
diffusion-modelsfine-tuningtrainingai-tools - 最后活动时间: 2026-04-18
autogluon
AWS开源的AutoML框架,仅需3行代码即可实现快速准确的机器学习,支持表格数据、图像、文本和时间序列。
- Stars: ⭐️ 10.2k
- Tags:
AutoMLDeep LearningPyTorch - 最后活动时间: 2026-04-17
OpenRLHF
基于Ray的高性能RLHF框架,支持PPO、DAPO、REINFORCE++等算法,集成vLLM加速。
- Stars: ⭐️ 9.4k
- Tags:
RLHFPPORayvLLM - 最后活动时间: 2026-04-18
oumi
一站式LLM/VLM训练平台,支持Qwen3、DeepSeek-R1等主流开源模型的微调、评估与部署。
- Stars: ⭐️ 9.2k
- Tags:
微调LLMVLM - 最后活动时间: 2026-04-17
ART
基于GRPO的多步智能体强化训练框架,支持Qwen3.5、Llama等主流模型的真实任务训练。
- Stars: ⭐️ 9.2k
- Tags:
GRPOReinforcement LearningAgent Training - 最后活动时间: 2026-04-18
LMFlow
可扩展的大模型微调与推理工具包,让大模型微调触手可及。
- Stars: ⭐️ 8.5k
- Tags:
模型微调工具包PyTorch - 最后活动时间: 2026-04-11
auto-sklearn
基于scikit-learn的自动机器学习框架,自动完成模型选择与超参优化。
- Stars: ⭐️ 8.1k
- Tags:
automlhyperparameter-optimizationscikit-learnbayesian-optimization - 最后活动时间: 2026-04-18
hyperopt
分布式异步超参数优化Python库,支持多种优化算法和并行计算,是机器学习模型调参的核心工具。
- Stars: ⭐️ 7.6k
- Tags:
hyperparameter-optimizationmachine-learningpython - 最后活动时间: 2026-03-16
gpt-neox
基于Megatron和DeepSpeed的大规模分布式训练框架,支持模型并行自回归Transformer训练,适用于GPT类大语言模型的训练。
- Stars: ⭐️ 7.4k
- Tags:
GPT分布式训练DeepSpeed - 最后活动时间: 2026-04-13
mergekit
用于合并预训练大语言模型的工具包,支持多种合并策略,帮助开发者创建更强大的模型。
- Stars: ⭐️ 7.0k
- Tags:
LLMModel MergingFine-tuning - 最后活动时间: 2026-03-15
rf-detr
Roboflow开发的实时目标检测与分割模型架构,在COCO数据集上达到SOTA水平,专为微调优化设计。
- Stars: ⭐️ 6.4k
- Tags:
object-detectioninstance-segmentationcomputer-visiondetrfine-tuning - 最后活动时间: 2026-04-16
Liger-Kernel
LinkedIn开源的高效Triton内核库,专为LLM训练优化,显著提升训练效率。
- Stars: ⭐️ 6.3k
- Tags:
tritonllm-trainingkernelsoptimization - 最后活动时间: 2026-04-18
torchtune
PyTorch原生训练后库,提供模型微调、量化等工具,支持LLaMA、Mistral等主流大模型。
- Stars: ⭐️ 5.7k
- Tags:
pytorchfine-tuningllmquantization - 最后活动时间: 2026-04-18
alignment-handbook
大语言模型对齐配方集合,提供RLHF等人类偏好对齐的完整训练流程和最佳实践。
- Stars: ⭐️ 5.6k
- Tags:
RLHFLLM对齐微调 - 最后活动时间: 2026-04-08
rllm
面向LLM的强化学习平台,支持分布式训练、推理优化和智能体工作流。
- Stars: ⭐️ 5.4k
- Tags:
RL for LLMsDistributed TrainingLLM Reasoning - 最后活动时间: 2026-04-18
slime
一个专注于LLM强化学习扩展的后训练框架,支持大规模模型的高效微调与优化。
- Stars: ⭐️ 5.4k
- Tags:
RLPost-trainingLLM - 最后活动时间: 2026-04-18
MedicalGPT
完整的医疗大模型训练流程,支持增量预训练、RLHF、DPO、ORPO等多种训练方法,助力构建医疗领域GPT模型。
- Stars: ⭐️ 5.3k
- Tags:
医疗大模型RLHFDPO - 最后活动时间: 2026-04-14
torchtitan
PyTorch原生生成式AI模型训练平台,提供高效的大模型训练解决方案。
- Stars: ⭐️ 5.2k
- Tags:
pytorchgenerative-aitrainingllm - 最后活动时间: 2026-04-18
notebooks
250+个微调和强化学习Notebook,覆盖文本、视觉、音频、嵌入和TTS模型。
- Stars: ⭐️ 5.2k
- Tags:
fine-tuningreinforcement-learningnotebooksunsloth - 最后活动时间: 2026-04-18
xtuner
专为超大规模MoE模型打造的下一代训练引擎,支持DeepSeek-V3、Qwen3-MoE等主流大模型的高效微调与训练。
- Stars: ⭐️ 5.1k
- Tags:
MoELLM训练微调框架 - 最后活动时间: 2026-04-18
AReaL
轻量高效的LLM推理强化学习框架,支持Agent训练与推理能力优化。
- Stars: ⭐️ 5.1k
- Tags:
强化学习RL训练LLM推理 - 最后活动时间: 2026-04-18
super-gradients
一站式计算机视觉模型训练库,内置Yolo-NAS等SOTA模型,支持快速微调。
- Stars: ⭐️ 5.0k
- Tags:
computer-visiontrainingyolo-nas - 最后活动时间: 2026-02-24
transformerlab-app
开源AI研究环境,支持从本地硬件到GPU集群无缝训练、评估和扩展模型。
- Stars: ⭐️ 4.9k
- Tags:
模型训练LoRARLHF - 最后活动时间: 2026-04-18
h2o-llmstudio
H2O推出的LLM微调框架,提供无代码GUI界面,支持多种开源大模型微调。
- Stars: ⭐️ 4.9k
- Tags:
LLMFine-tuningNo-Code - 最后活动时间: 2026-04-08
EasyR1
基于veRL构建的高效多模态强化学习训练框架,支持DeepSeek、Qwen等主流模型。
- Stars: ⭐️ 4.9k
- Tags:
强化学习多模态训练框架 - 最后活动时间: 2026-04-06
ignite
PyTorch高级神经网络训练与评估库,提供灵活透明的深度学习训练流程和丰富的指标监控功能。
- Stars: ⭐️ 4.8k
- Tags:
pytorchdeep-learningneural-networkmachine-learning - 最后活动时间: 2026-04-15
align-anything
全模态模型对齐训练框架,支持DPO和RLHF反馈驱动训练。
- Stars: ⭐️ 4.6k
- Tags:
AlignmentRLHFMultimodal - 最后活动时间: 2025-11-27
autotrain-advanced
HuggingFace AutoTrain高级版,自动化机器学习模型训练流程,支持NLP等任务。
- Stars: ⭐️ 4.6k
- Tags:
AutoMLTrainingHuggingFace - 最后活动时间: 2026-04-17
Search-R1
高效可扩展的强化学习训练框架,支持推理与搜索引擎调用的交错LLM训练。
- Stars: ⭐️ 4.5k
- Tags:
RL TrainingReasoningSearch Engine - 最后活动时间: 2025-11-13
llm-foundry
Databricks开源的LLM训练代码库,用于构建企业级基础大模型。
- Stars: ⭐️ 4.4k
- Tags:
模型训练Databricks企业级 - 最后活动时间: 2026-03-25
FLAML
快速AutoML和超参数优化库,支持分类、回归和时间序列任务。
- Stars: ⭐️ 4.3k
- Tags:
automlhyperparameter-optimizationmachine-learningpython - 最后活动时间: 2026-04-17
nevergrad
Facebook Research 开源的无梯度优化工具箱,广泛用于机器学习超参数调优和黑盒优化问题。
- Stars: ⭐️ 4.2k
- Tags:
optimizationhyperparameter-tuningmachine-learninggradient-free - 最后活动时间: 2026-03-16
Train_Custom_Dataset
自定义数据集标注与AI模型训练工具链,涵盖数据标注、模型训练、评估测试到部署的完整流程。
- Stars: ⭐️ 4.0k
- Tags:
trainingannotationcustom-datasetdeployment - 最后活动时间: 2026-01-07
lightly
专注于图像自监督学习的Python库,提供对比学习和嵌入提取功能,简化数据标注流程。
- Stars: ⭐️ 3.7k
- Tags:
Self-Supervised LearningPyTorchComputer Vision - 最后活动时间: 2026-04-10
ReAgent
推理系统平台,支持强化学习和上下文赌博算法,用于模型训练优化。
- Stars: ⭐️ 3.7k
- Tags:
reinforcement-learningreasoningml-platformcontextual-bandits - 最后活动时间: 2026-04-18
botorch
Facebook AI贝叶斯优化库,用于超参数调优和实验设计。
- Stars: ⭐️ 3.5k
- Tags:
bayesian-optimizationhyperparameter-tuningpytorch - 最后活动时间: 2026-04-17
mljar-supervised
自动化机器学习Python包,支持表格数据的特征工程、超参数调优与自动文档生成。
- Stars: ⭐️ 3.2k
- Tags:
AutoMLFeature EngineeringHyperparameter TuningXGBoost - 最后活动时间: 2026-03-26
igel
无需编写代码即可训练、测试和使用机器学习模型的自动化ML工具。
- Stars: ⭐️ 3.1k
- Tags:
automlmachine-learningno-codescikit-learn - 最后活动时间: 2025-12-07
llm-compressor
与Transformers兼容的LLM压缩库,支持量化、稀疏化等压缩算法,显著降低推理成本和内存占用。
- Stars: ⭐️ 3.1k
- Tags:
模型压缩量化vLLM - 最后活动时间: 2026-04-18
ROLL
高效易用的大语言模型强化学习扩展库,支持RLHF和RLVR训练范式。
- Stars: ⭐️ 3.1k
- Tags:
rlhfrlvragenticreinforcement-learning - 最后活动时间: 2026-04-19
keras-tuner
Keras官方超参数调优库,自动化模型超参数搜索与优化流程。
- Stars: ⭐️ 2.9k
- Tags:
kerashyperparameter-optimizationautomltensorflow - 最后活动时间: 2025-12-01
learn2learn
PyTorch元学习研究库,支持MAML、少样本学习等元学习算法。
- Stars: ⭐️ 2.9k
- Tags:
meta-learningfew-shotmamlpytorch - 最后活动时间: 2025-12-16
adapters
参数高效迁移学习统一库,支持LoRA、Adapter等多种微调方法。
- Stars: ⭐️ 2.8k
- Tags:
AdaptersLoRAFine-tuning - 最后活动时间: 2026-03-21
rl-baselines3-zoo
Stable Baselines3强化学习智能体训练框架,内置超参数优化和预训练模型。
- Stars: ⭐️ 2.8k
- Tags:
RL TrainingHyperparameter OptimizationPyTorch - 最后活动时间: 2026-04-02
EasyEdit
ACL 2024论文项目,易用的LLM知识编辑框架,支持模型知识更新与遗忘。
- Stars: ⭐️ 2.8k
- Tags:
Knowledge EditingLLMACL 2024 - 最后活动时间: 2026-04-01
setfit
基于Sentence Transformers的高效少样本学习框架,用少量数据实现高质量文本分类。
- Stars: ⭐️ 2.7k
- Tags:
few-shot-learningsentence-transformersnlp - 最后活动时间: 2026-04-17
physicsnemo
NVIDIA开源的物理机器学习深度学习框架,支持构建、训练和微调最先进的物理ML模型。
- Stars: ⭐️ 2.7k
- Tags:
deep-learningphysicspytorchnvidia-gpu - 最后活动时间: 2026-04-17
maestro
多模态模型微调工具,支持PaliGemma 2、Florence-2和Qwen2.5-VL等主流视觉语言模型的精调流程。
- Stars: ⭐️ 2.7k
- Tags:
Fine-tuningMultimodalVision-Language - 最后活动时间: 2026-04-13
xTuring
一站式LLM个性化解决方案,从数据预处理到微调全流程覆盖,支持LoRA、PEFT、量化等高效微调技术。
- Stars: ⭐️ 2.7k
- Tags:
Fine-tuningLoRAPEFT - 最后活动时间: 2026-03-04
nanotron
轻量级大语言模型3D并行训练框架,提供简洁高效的分布式训练解决方案。
- Stars: ⭐️ 2.7k
- Tags:
training3d-parallelismdistributed-trainingllm - 最后活动时间: 2026-04-07
LyCORIS
超越传统 LoRA 的秩适配方法,为 Stable Diffusion 提供高效微调方案。
- Stars: ⭐️ 2.5k
- Tags:
stable-diffusionfinetuninglora - 最后活动时间: 2026-04-11
Muon
专为神经网络隐藏层设计的优化器,提升模型训练效率和收敛速度。
- Stars: ⭐️ 2.5k
- Tags:
optimizerneural-networkdeep-learningtraining - 最后活动时间: 2026-01-19
Visual-RFT
视觉强化微调官方实现,支持视觉代理强化微调训练方法。
- Stars: ⭐️ 2.3k
- Tags:
visual-rftreinforcement-learningfine-tuningmultimodal - 最后活动时间: 2025-10-29
maxtext
基于JAX构建的高性能大语言模型训练框架,支持Llama、Gemma、Mistral等主流模型架构。
- Stars: ⭐️ 2.2k
- Tags:
JAXLLM训练微调 - 最后活动时间: 2026-04-18
optax
JAX生态系统的梯度处理与优化库,提供丰富的优化器与梯度变换工具,广泛用于深度学习模型训练。
- Stars: ⭐️ 2.2k
- Tags:
optimizationjaxmachine-learningdeep-learning - 最后活动时间: 2026-04-15
tunix
轻量级LLM后训练库,专注于大语言模型的微调与训练流程优化。
- Stars: ⭐️ 2.2k
- Tags:
LLMPost-TrainingFine-tuning - 最后活动时间: 2026-04-18
flow_grpo
NeurIPS 2025论文官方实现,通过在线强化学习训练Flow Matching模型。
- Stars: ⭐️ 2.2k
- Tags:
GRPOFlow MatchingRL - 最后活动时间: 2025-11-04
trainer
基于Kubernetes的分布式AI模型训练和LLM微调平台,支持PyTorch、TensorFlow、JAX等主流框架。
- Stars: ⭐️ 2.1k
- Tags:
KubernetesFine-tuningDistributed Training - 最后活动时间: 2026-04-17
ViZDoom
基于经典游戏Doom的强化学习研究平台,提供标准化的RL环境接口。
- Stars: ⭐️ 2.0k
- Tags:
reinforcement-learninggame-aideep-learninggym-environment - 最后活动时间: 2026-03-04
privacy
机器学习隐私训练库,保护训练数据隐私安全。
- Stars: ⭐️ 2.0k
- Tags:
privacymachine-learningdifferential-privacy - 最后活动时间: 2026-04-06
augmentoolkit
用于创建自定义LLM的工具包,支持数据集生成和模型微调流程。
- Stars: ⭐️ 1.8k
- Tags:
aidataset-generationfinetuning-llms - 最后活动时间: 2025-11-08
Qwen-VL-Series-Finetune
开源的Qwen-VL系列视觉语言模型微调实现,支持Qwen2-VL、Qwen2.5-VL、Qwen3-VL等多个版本。
- Stars: ⭐️ 1.8k
- Tags:
Qwen-VL微调多模态 - 最后活动时间: 2026-04-10
SkyRL
模块化的全栈强化学习库,专为LLM训练设计,支持分布式训练与高效扩展。
- Stars: ⭐️ 1.8k
- Tags:
RL LibraryLLM TrainingDistributed - 最后活动时间: 2026-04-17
RL-Factory
高效易用的强化学习框架,旨在简化智能体模型的训练流程。
- Stars: ⭐️ 1.7k
- Tags:
Reinforcement LearningTraining FrameworkAI Agents - 最后活动时间: 2025-12-05
multimodal
Meta官方的PyTorch多模态训练库,支持大规模多任务多模态模型训练。
- Stars: ⭐️ 1.7k
- Tags:
multimodalpytorchdeep-learningtraining - 最后活动时间: 2026-04-13
dlrover
自动化分布式深度学习系统,简化大规模模型训练的集群调度和资源管理,支持LLM训练优化。
- Stars: ⭐️ 1.6k
- Tags:
Distributed TrainingDeep LearningLLM Training - 最后活动时间: 2026-04-15
simple_GRPO
极简GRPO实现,用于复现R1风格的LLM推理能力。
- Stars: ⭐️ 1.6k
- Tags:
GRPOR1LLM Training - 最后活动时间: 2025-11-21
vizier
Google开源的黑盒优化与超参数调优研究接口,支持贝叶斯优化、进化算法等多种优化策略,适用于深度学习模型的超参数搜索。
- Stars: ⭐️ 1.6k
- Tags:
Hyperparameter OptimizationBayesian OptimizationMachine Learning - 最后活动时间: 2026-02-17
torchdistill
基于PyTorch的知识蒸馏框架,实现26+种蒸馏方法,支持图像分类、目标检测、NLP等任务。
- Stars: ⭐️ 1.6k
- Tags:
knowledge-distillationpytorchmodel-compressiondeep-learning - 最后活动时间: 2026-03-31
safe-rlhf
基于安全强化学习的人类反馈对齐方法,实现大语言模型的安全价值对齐,支持多种开源模型。
- Stars: ⭐️ 1.6k
- Tags:
rlhfai-safetyllmreinforcement-learning - 最后活动时间: 2025-11-24
model-optimization
TensorFlow模型优化工具包,支持量化、剪枝和稀疏化,加速模型部署。
- Stars: ⭐️ 1.6k
- Tags:
quantizationpruningmodel-compressiontensorflow - 最后活动时间: 2026-04-14
Semi-supervised-learning
NeurIPS'22发表的统一半监督学习代码库,支持视觉、音频、NLP多领域分类任务。
- Stars: ⭐️ 1.6k
- Tags:
semi-supervised-learningdeep-learningpytorchtransformer - 最后活动时间: 2026-03-30
pyreft
斯坦福NLP团队开发的表示微调库,提供高效的模型微调方法。
- Stars: ⭐️ 1.6k
- Tags:
reftrepresentation-finetuninginterpretabilitynlp - 最后活动时间: 2026-03-05
neat-python
NEAT神经进化算法的Python实现,用于通过进化算法自动优化神经网络拓扑结构和权重。
- Stars: ⭐️ 1.6k
- Tags:
neuroevolutionneural-networkgenetic-algorithmpython - 最后活动时间: 2026-04-10
Pai-Megatron-Patch
阿里云官方开源的大规模LLM与VLM训练框架,支持分布式训练与高效并行。
- Stars: ⭐️ 1.6k
- Tags:
llmtrainingmegatrondistributed - 最后活动时间: 2025-12-15
lightly-train
一站式视觉模型训练工具,支持YOLO、ViT、RT-DETR等主流架构的预训练、微调和蒸馏。
- Stars: ⭐️ 1.4k
- Tags:
computer-visiondeep-learningpytorchyolovision-transformer - 最后活动时间: 2026-04-17
reasoning-gym
NeurIPS 2025 Spotlight,提供可验证奖励的强化学习推理环境,用于训练大语言模型推理能力。
- Stars: ⭐️ 1.4k
- Tags:
reinforcement-learningreasoninglarge-language-modelsgym - 最后活动时间: 2026-04-17
finetrainers
可扩展且内存优化的扩散模型训练框架,支持高效微调Stable Diffusion等模型。
- Stars: ⭐️ 1.4k
- Tags:
diffusion-modelsfine-tuningpytorchtraining - 最后活动时间: 2026-04-08
gemma-tuner-multimodal
在 Apple Silicon 上微调 Gemma 4 和 3n 多模态模型的工具,支持音频、图像和文本输入。
- Stars: ⭐️ 1.3k
- Tags:
fine-tuninggemmamultimodalapple-siliconpytorch - 最后活动时间: 2026-04-17
prime-rl
大规模智能体强化学习训练框架,支持分布式RL训练。
- Stars: ⭐️ 1.3k
- Tags:
reinforcement-learningrlagentstraining - 最后活动时间: 2026-04-18
Gradient-Free-Optimizers
轻量级无梯度优化库,支持贝叶斯优化、进化策略、粒子群等多种超参数优化方法。
- Stars: ⭐️ 1.3k
- Tags:
bayesian-optimizationhyperparameter-optimizationblackbox-optimization - 最后活动时间: 2026-04-18
argmin
纯Rust实现的数值优化库,提供多种优化算法,可用于机器学习模型训练和参数优化。
- Stars: ⭐️ 1.2k
- Tags:
optimizationnumerical-optimizationrustmachine-learning - 最后活动时间: 2025-11-07
GongBU
CIKM 2024论文项目,面向领域适配的大语言模型微调平台。
- Stars: ⭐️ 1.2k
- Tags:
llmfine-tuningdomain-adaptationplatform - 最后活动时间: 2026-01-22
training_extensions
基于OpenVINO™的计算机视觉模型全流程工具链,支持训练、评估、优化和部署。
- Stars: ⭐️ 1.2k
- Tags:
OpenVINO计算机视觉模型优化 - 最后活动时间: 2026-04-18
Whisper-Finetune
Whisper语音识别模型微调工具,支持无时间戳数据训练、多平台部署(Web/Windows/Android)和推理加速。
- Stars: ⭐️ 1.2k
- Tags:
ASRFine-tuningWhisper - 最后活动时间: 2025-12-17
mlx-tune
在 Apple Silicon Mac 上原生微调大语言模型的开源工具,支持 SFT、DPO、GRPO 及视觉语言模型微调,兼容 Unsloth API。
- Stars: ⭐️ 1.2k
- Tags:
MLXLLM微调Apple Silicon本地训练 - 最后活动时间: 2026-04-18
nncf
Intel开源的神经网络压缩框架,支持量化、剪枝、稀疏化等优化技术,专为OpenVINO推理加速设计。
- Stars: ⭐️ 1.1k
- Tags:
模型压缩量化OpenVINO - 最后活动时间: 2026-04-17
AutoGL
面向图机器学习的AutoML框架与工具包,自动化图神经网络训练与优化流程。
- Stars: ⭐️ 1.1k
- Tags:
automlgraph-neural-networksmachine-learning - 最后活动时间: 2025-11-20
sliders
用于精确控制扩散模型生成效果的滑块技术,通过调整概念滑块实现图像风格和内容的细粒度控制。
- Stars: ⭐️ 1.1k
- Tags:
Diffusion ModelsImage GenerationFine-tuning - 最后活动时间: 2026-04-13
MixGRPO
CVPR 2025 论文实现,通过混合 ODE-SDE 解锁基于 Flow 的 GRPO 效率,用于扩散模型优化。
- Stars: ⭐️ 1.1k
- Tags:
diffusiongrporeinforcement-learningfine-tuning - 最后活动时间: 2026-02-26
miles
企业级强化学习框架,专为LLM和VLM后训练设计,支持模型微调与优化。
- Stars: ⭐️ 1.1k
- Tags:
RLPost-trainingEnterprise - 最后活动时间: 2026-04-18
glue-factory
ICCV 2023,用于局部特征检测与匹配的训练库。
- Stars: ⭐️ 1.1k
- Tags:
feature-detectionimage-matchingtraining - 最后活动时间: 2025-11-04
PyCIL
类增量学习Python工具箱,支持持续学习和开放世界识别研究。
- Stars: ⭐️ 1.1k
- Tags:
continual-learningincremental-learningpytorchdeep-learning - 最后活动时间: 2026-01-29
geoopt
基于PyTorch的黎曼流形优化库,支持在弯曲空间中进行自适应优化,适用于处理层次结构和双曲嵌入等场景。
- Stars: ⭐️ 1.1k
- Tags:
optimizationpytorchriemannian-geometry - 最后活动时间: 2026-04-18
TTRL
NeurIPS 2025论文,测试时强化学习方法,无需标注数据即可提升模型推理能力。
- Stars: ⭐️ 1.1k
- Tags:
reinforcement-learningllmreasoningtest-time - 最后活动时间: 2026-04-15
morph-net
快速简单的资源约束深度网络结构学习框架,支持神经网络架构自动搜索与优化。
- Stars: ⭐️ 1.0k
- Tags:
automlneural-architecture-searchdeep-learningtensorflow - 最后活动时间: 2026-02-09
neural-structured-learning
Google开发的框架,用于训练具有结构化信号的神经网络,支持对抗学习和图神经网络。
- Stars: ⭐️ 1.0k
- Tags:
neural-networkadversarial-learninggraph-learningtensorflow - 最后活动时间: 2026-02-11
open-metric-learning
度量学习与检索管道框架,提供预训练模型与完整训练流程。
- Stars: ⭐️ 988
- Tags:
metric-learningcomputer-visiondeep-learningpytorch - 最后活动时间: 2025-11-26
TinyLLaVA_Factory
小型大规模多模态模型训练框架,专注于视觉语言模型的轻量化实现与训练。
- Stars: ⭐️ 976
- Tags:
MultimodalLLaVAVision-Language - 最后活动时间: 2026-04-17
DoRA
ICML2024 Oral论文官方实现,提出权重分解低秩适应方法,显著提升LLM和视觉语言模型的微调效果。
- Stars: ⭐️ 959
- Tags:
Fine-tuningLoRALLMVision-Language - 最后活动时间: 2026-03-24
Nemotron
NVIDIA官方的Nemotron模型开发者资源中心,提供训练配方、数据集、微调指南和端到端参考示例。
- Stars: ⭐️ 957
- Tags:
nvidianemotronfine-tuningmodel-trainingreinforcement-learning - 最后活动时间: 2026-04-17
LLM-Dojo
轻量级LLM后训练框架,支持SFT、RLVR、知识蒸馏及混合训练,提供多教师蒸馏与自动化数据分流功能。
- Stars: ⭐️ 934
- Tags:
LLMFine-tuningKnowledge-DistillationSFTRLVR - 最后活动时间: 2026-03-08
DistillKit
开源LLM蒸馏工具包,提供模型知识蒸馏的完整解决方案。
- Stars: ⭐️ 928
- Tags:
distillationllmfine-tuningknowledge-transfer - 最后活动时间: 2026-03-14
baal
贝叶斯主动学习库,支持研究和工业场景。基于PyTorch实现,可用于模型不确定性估计和高效数据标注。
- Stars: ⭐️ 925
- Tags:
active-learningbayesiandeep-learningpytorchuncertainty - 最后活动时间: 2025-12-03
compression
TensorFlow数据压缩库,利用深度神经网络实现高效数据压缩。
- Stars: ⭐️ 913
- Tags:
compressiondeep-learningtensorflowneural-network - 最后活动时间: 2026-04-17
AgileRL
强化学习RLOps框架,通过进化超参数优化实现10倍加速训练。支持多智能体和分布式训练。
- Stars: ⭐️ 909
- Tags:
Reinforcement LearningRLOpsPyTorch - 最后活动时间: 2026-04-17
Jackrong-llm-finetuning-guide
LLM大模型微调指南,涵盖Llama3、Qwen、DeepSeek等主流模型的微调方法和实践。
- Stars: ⭐️ 843
- Tags:
llmfine-tuningpytorchunsloth - 最后活动时间: 2026-04-11
Gym
专为LLM训练设计的强化学习环境构建框架,支持多种RL算法和环境配置。
- Stars: ⭐️ 837
- Tags:
RLLLM TrainingEnvironment - 最后活动时间: 2026-04-18
dreamerv3-torch
Dreamer v3强化学习算法的PyTorch实现,世界模型方法的代表性工作。
- Stars: ⭐️ 836
- Tags:
reinforcement-learningpytorchdeep-learningworld-model - 最后活动时间: 2026-03-08
Optimization.jl
Julia语言的统一数学优化接口,支持局部/全局优化、凸优化、混合整数规划等,内置自动微分功能,广泛应用于机器学习模型训练与科学计算。
- Stars: ⭐️ 825
- Tags:
optimizationjuliaautomatic-differentiationmachine-learning - 最后活动时间: 2026-04-10
llm-engine
Scale AI开源的LLM引擎,提供高效的大模型微调能力。
- Stars: ⭐️ 823
- Tags:
Fine-tuningLLMScale AI - 最后活动时间: 2026-04-18
ensmallen
轻量级C++数值优化库,广泛用于机器学习模型训练优化。
- Stars: ⭐️ 806
- Tags:
optimizationmachine-learningdeep-learningcpp - 最后活动时间: 2026-04-18
mammoth
基于PyTorch的可扩展持续学习框架,NeurIPS 2020官方代码库,支持多种训练策略。
- Stars: ⭐️ 803
- Tags:
continual-learningpytorchdeep-learning - 最后活动时间: 2026-04-12
kohya-colab
基于kohya-ss工作的Stable Diffusion LoRA训练Colab笔记本集合,提供便捷的模型微调解决方案。
- Stars: ⭐️ 797
- Tags:
stable-diffusionlora-trainingcolabfine-tuning - 最后活动时间: 2026-02-05
SpecForge
推测解码模型训练工具,支持轻松训练并无缝迁移至 SGLang 推理服务。
- Stars: ⭐️ 787
- Tags:
Speculative DecodingTrainingSGLang - 最后活动时间: 2026-04-02
SDPO
通过自蒸馏实现强化学习,提升LLM推理能力的训练方法。
- Stars: ⭐️ 781
- Tags:
rldistillationreasoning - 最后活动时间: 2026-02-18
terratorch
专注于地理空间基础模型微调的Python工具包,支持地球观测和气象模型。
- Stars: ⭐️ 773
- Tags:
geospatialfoundation-modelsdeep-learningearth-observationpytorch - 最后活动时间: 2026-04-10
lmms-engine
一个简洁统一的多模态模型训练引擎,支持大规模模型微调与开发,灵活且可扩展。
- Stars: ⭐️ 762
- Tags:
multimodaltrainingllm - 最后活动时间: 2026-04-18
finetune
提供Scikit-learn风格的NLP模型微调接口,简化Transformer模型的迁移学习流程。
- Stars: ⭐️ 721
- Tags:
finetuningnlptransformersscikit-learn - 最后活动时间: 2026-04-11
deep-symbolic-optimization
符号优化深度学习框架,用于自动发现数学公式和符号表达式。
- Stars: ⭐️ 720
- Tags:
symbolic-optimizationdeep-learningauto-discovery - 最后活动时间: 2026-01-23
MARS
面向大模型训练的方差缩减优化器官方实现,提升大规模模型预训练和微调效率。
- Stars: ⭐️ 718
- Tags:
OptimizerTrainingLLM - 最后活动时间: 2026-03-26
sparsify
使用稀疏自编码器和Transcoders对Transformer模型进行稀疏化处理。
- Stars: ⭐️ 711
- Tags:
sparse-autoencodermechanistic-interpretabilitytransformer - 最后活动时间: 2026-04-13
FEDOT
自动化机器学习框架,支持进化算法和超参数优化。
- Stars: ⭐️ 703
- Tags:
automlmachine-learningevolutionary-algorithmshyperparameter-optimization - 最后活动时间: 2026-04-14
doc-to-lora
使用超网络让LLM记忆事实信息的创新方法,通过LoRA实现知识更新。
- Stars: ⭐️ 689
- Tags:
hypernetworkslorallmmemory - 最后活动时间: 2026-03-02
FL-bench
联邦学习基准测试平台,支持差分隐私和个性化联邦学习研究。
- Stars: ⭐️ 675
- Tags:
federated-learningdifferential-privacydeep-learningpytorch - 最后活动时间: 2026-01-25
torchforge
PyTorch原生的大规模训练后优化工具,支持量化、剪枝等模型压缩技术。
- Stars: ⭐️ 671
- Tags:
pytorchpost-trainingquantizationoptimization - 最后活动时间: 2026-04-18
quaterion
高效的相似度学习模型微调框架,基于PyTorch Lightning构建。
- Stars: ⭐️ 661
- Tags:
similarity-learningmetric-learningpytorchfine-tuning - 最后活动时间: 2026-04-06
oat
友好的LLM在线对齐研究框架,支持强化学习、偏好学习、DPO、PPO等多种方法。
- Stars: ⭐️ 647
- Tags:
RLHFDPOLLM Alignment - 最后活动时间: 2026-01-29
small-text
Python文本分类主动学习库,支持深度学习、Transformer和小语言模型。
- Stars: ⭐️ 638
- Tags:
active-learningtext-classificationtransformerspytorch - 最后活动时间: 2026-04-17
MS-AMP
微软开源的自动混合精度训练库,支持FP8精度,优化GPU显存使用并加速深度学习模型训练。
- Stars: ⭐️ 636
- Tags:
Mixed PrecisionDeep LearningFP8PyTorch - 最后活动时间: 2025-12-01
Trinity-RFT
一个通用、灵活且可扩展的大语言模型强化微调框架,支持RLHF训练流程。
- Stars: ⭐️ 608
- Tags:
llmrlhffine-tuningreinforcement-learning - 最后活动时间: 2026-04-09
LightReasoner
探索小语言模型如何教导大语言模型进行推理的创新方法。
- Stars: ⭐️ 598
- Tags:
reasoningknowledge-distillationsmall-language-modelspost-training - 最后活动时间: 2026-04-07
e2e
长上下文端到端测试时训练的官方JAX实现,专注于提升模型在长序列任务上的表现。
- Stars: ⭐️ 592
- Tags:
JAXTest-Time TrainingLong Context - 最后活动时间: 2026-02-15
Awesome-Parameter-Efficient-Transfer-Learning
参数高效微调技术精选合集,涵盖LoRA、Adapter、Prefix Tuning等前沿方法的论文与代码资源。
- Stars: ⭐️ 590
- Tags:
LoRAAdapter微调迁移学习 - 最后活动时间: 2025-12-10
mistral
透明可访问的大规模语言模型训练框架,基于Hugging Face Transformers构建。
- Stars: ⭐️ 579
- Tags:
llm-traininghuggingfacetransformers - 最后活动时间: 2026-03-11
LAMDA-PILOT
基于预训练模型的持续学习工具箱,支持增量学习和终身学习场景。
- Stars: ⭐️ 572
- Tags:
持续学习预训练模型PyTorch - 最后活动时间: 2026-01-29
AngelSlim
腾讯开源的模型压缩工具包,支持LLM/VLM量化、FP4压缩、推测解码等技术,覆盖DeepSeek、Qwen等主流模型。
- Stars: ⭐️ 568
- Tags:
QuantizationModel CompressionLLM - 最后活动时间: 2026-04-16
Enzyme.jl
Julia语言的Enzyme自动微分绑定,支持编译器级别的自动微分,适用于深度学习训练优化。
- Stars: ⭐️ 557
- Tags:
automatic-differentiationjuliaenzymemachine-learning - 最后活动时间: 2026-04-10
paxml
基于JAX的大规模机器学习训练框架,支持高级并行化与业界领先的模型利用率。
- Stars: ⭐️ 549
- Tags:
jaxllmtrainingparallelism - 最后活动时间: 2026-04-09
Hyperactive
统一的优化算法接口,支持超参数优化、神经网络架构搜索和特征工程自动化。
- Stars: ⭐️ 549
- Tags:
hyperparameter-optimizationneural-architecture-searchoptimizationmachine-learning - 最后活动时间: 2026-04-13
SteptronOss
轻量级AI原生训练框架,支持SFT、RLVR和评估工作流,专为快速迭代和可复现实验设计。
- Stars: ⭐️ 549
- Tags:
training-frameworkllmfine-tuningrlvr - 最后活动时间: 2026-04-07
happy-transformer
简化NLP Transformer模型的微调和推理,支持BERT、RoBERTa等模型。
- Stars: ⭐️ 544
- Tags:
nlptransformersfine-tuningbert - 最后活动时间: 2026-01-10
autofeat
自动化特征工程与选择的线性预测模型工具。
- Stars: ⭐️ 536
- Tags:
automated-feature-engineeringfeature-selectionautoml - 最后活动时间: 2026-01-06
simply
基于JAX的极简可扩展研究代码库,专为LLM和自回归模型的前沿研究快速迭代设计。
- Stars: ⭐️ 518
- Tags:
jaxllmresearchautoregressive - 最后活动时间: 2026-04-17
