☁️ 基础设施与部署 (Infrastructure & Deployment)
模型推理引擎(如vLLM, Ollama)、MLOps工具、GPU调度系统与高性能内核。
netdata
开源的实时监控与可观测性平台,集成AI驱动的异常检测和智能告警功能。支持容器、Kubernetes和各类数据库的一键部署监控。
- Stars: ⭐️ 78.2k
- Tags:
监控可观测性DevOps - 最后活动时间: 2026-03-20
vllm
vLLM是一个高吞吐量且内存高效的LLM推理和服务引擎,采用PagedAttention技术显著优化显存利用率。广泛应用于生产环境的大模型部署,支持多种主流模型架构和硬件平台。
- Stars: ⭐️ 73.8k
- Tags:
LLMInferenceServingCUDAPyTorch - 最后活动时间: 2026-03-20
LocalAI
免费开源的 OpenAI API 替代方案,支持本地部署、无需 GPU,可在消费级硬件上运行。兼容 OpenAI API,支持文本生成、图像生成、语音克隆等多种 AI 功能。
- Stars: ⭐️ 44.1k
- Tags:
LLMSelf-hostedOpenAI APILocal Inference - 最后活动时间: 2026-03-20
nano-vllm
轻量级 vLLM 实现,专注于大语言模型的高效推理。适合学习 vLLM 架构和轻量级部署场景。
- Stars: ⭐️ 12.3k
- Tags:
LLM推理引擎PyTorch - 最后活动时间: 2025-11-03
h2ogpt
开源的私有化GPT聊天工具,支持本地部署和多种文档格式处理。100%隐私保护,支持oLLaMa、Mixtral等多种LLM后端。
- Stars: ⭐️ 12.0k
- Tags:
私有化部署文档问答多模态 - 最后活动时间: 2025-10-09
meetily
隐私优先的AI会议助手,支持Parakeet/Whisper实时转录和Ollama本地总结,100%本地处理无需云端。
- Stars: ⭐️ 10.5k
- Tags:
AI会议助手语音转文字本地AI隐私保护 - 最后活动时间: 2026-03-16
Liger-Kernel
由LinkedIn开源的高效Triton内核库,专为LLM训练优化设计。支持Llama、Mistral、Gemma等主流大模型,显著提升训练效率。
- Stars: ⭐️ 6.2k
- Tags:
tritonllm-trainingkernelsoptimization - 最后活动时间: 2026-03-20
qsv
一款超快的数据处理工具包,支持CSV、Excel、Parquet等多种格式的数据清洗与转换。专为数据工程师设计,大幅提升数据预处理效率。
- Stars: ⭐️ 3.5k
- Tags:
data-wranglingcsvdata-engineering - 最后活动时间: 2026-03-20
optimum
Hugging Face 官方推出的硬件优化工具包,可加速 Transformers、Diffusers 等模型的推理与训练。支持 ONNX、量化及多种硬件后端优化。
- Stars: ⭐️ 3.3k
- Tags:
optimizationinferencetransformersquantization - 最后活动时间: 2026-03-13
deep-eye
一款AI驱动的漏洞扫描与渗透测试工具,集成OpenAI、Grok、OLLAMA、Claude等多种AI模型,支持自动化漏洞挖掘、智能载荷生成和专业报告输出。
- Stars: ⭐️ 664
- Tags:
安全测试渗透测试AI驱动 - 最后活动时间: 2026-02-03
reverse-engineering-assistant
基于MCP协议的逆向工程助手,支持Ghidra和Binary Ninja等工具。让LLM辅助分析二进制文件,提升安全研究效率。
- Stars: ⭐️ 647
- Tags:
MCPGhidra逆向工程LLM - 最后活动时间: 2026-03-16
Hello-AI