☁️ 基础设施与部署

Hardware integration, cloud infra, and model serving.

当前分类已收录 956 个相关项目。

Cloud & Hosting

netdata

AI驱动的全栈可观测性平台，提供实时监控和智能告警功能。支持容器、Kubernetes等多种环境的自动化运维。

Stars: ⭐️ 79.1k
Tags: Observability Monitoring Machine Learning
最后活动时间: 2026-06-12

daytona

专为AI智能体设计的安全沙箱基础设施，提供代码执行能力和隔离环境，保障AI生成代码的安全运行。

Stars: ⭐️ 72.5k
Tags: AI沙箱 代码执行 基础设施
最后活动时间: 2026-06-12

minio

高性能、S3兼容的开源对象存储系统，适用于AI模型和数据集的云原生存储解决方案。

Stars: ⭐️ 61.2k
Tags: object-storage s3 kubernetes cloud-native
最后活动时间: 2026-04-24

appwrite

完整的云端基础设施平台，支持Web、移动和AI应用开发，包含认证、数据库、存储等服务。

Stars: ⭐️ 56.3k
Tags: backend-as-a-service cloud serverless ai-infrastructure
最后活动时间: 2026-06-12

kong

云原生API和AI网关，支持LLM请求路由、MCP协议和OpenAI代理，统一管理AI应用流量。

Stars: ⭐️ 43.6k
Tags: API Gateway AI Gateway LLM
最后活动时间: 2026-06-10

spark

Apache Spark统一大数据分析引擎，内置MLlib机器学习库，支持大规模数据处理和AI模型训练。

Stars: ⭐️ 43.4k
Tags: big-data machine-learning data-processing distributed-computing
最后活动时间: 2026-06-12

data-engineer-handbook

数据工程师学习资源大全，涵盖Spark、大数据处理、SQL等核心技术。为AI/ML数据管道构建提供重要基础设施知识。

Stars: ⭐️ 41.6k
Tags: data-engineering bigdata apachespark sql
最后活动时间: 2026-04-02

1Panel

现代化Linux服务器运维面板，支持一键部署Ollama等AI应用，简化VPS管理流程。

Stars: ⭐️ 35.9k
Tags: Docker 服务器管理 Ollama
最后活动时间: 2026-06-12

nacos

阿里巴巴开源的服务发现与配置管理平台，支持MCP注册和AI Agent注册，助力AI云原生应用构建。

Stars: ⭐️ 33.0k
Tags: 服务发现 MCP注册 AI云原生
最后活动时间: 2026-06-11

rustfs

高性能AI原生对象存储系统，兼容S3协议，比MinIO快2.3倍，专为AI工作负载设计。

Stars: ⭐️ 28.7k
Tags: AI存储 S3兼容 高性能
最后活动时间: 2026-06-12

sub2api

一站式 AI API 中转服务，统一接入 Claude、OpenAI、Gemini 等订阅，支持拼车共享分摊成本。

Stars: ⭐️ 27.4k
Tags: api-proxy claude openai gemini subscription
最后活动时间: 2026-06-12

airbyte

领先的数据集成平台，支持从API、数据库和文件到数据仓库的ETL/ELT数据管道构建，为AI/ML系统提供可靠的数据基础设施。

Stars: ⭐️ 21.4k
Tags: data-integration data-pipeline etl elt data-engineering
最后活动时间: 2026-06-12

anubis

HTTP 请求分析工具，用于识别和阻止 AI 爬虫，保护网站资源免受滥用。

Stars: ⭐️ 19.9k
Tags: ai-crawler security defense http
最后活动时间: 2026-06-11

sealos

基于Kubernetes的AI原生云操作系统，支持从云端IDE开发到生产部署的完整应用生命周期管理，非常适合构建和扩展现代AI应用。

Stars: ⭐️ 18.0k
Tags: Kubernetes Cloud OS AI Infrastructure
最后活动时间: 2026-06-12

questdb

高性能开源时序数据库，专为金融分析和物联网监控等高频数据处理场景设计。

Stars: ⭐️ 17.1k
Tags: time-series-database sql high-performance financial-analysis
最后活动时间: 2026-06-12

kubesphere

面向Kubernetes多云、数据中心和边缘管理的容器平台，支持LLM工作负载部署与云原生AI基础设施。

Stars: ⭐️ 17.0k
Tags: Kubernetes Cloud Native DevOps LLM
最后活动时间: 2026-06-04

argo-workflows

Kubernetes原生工作流引擎，专为机器学习流水线和MLOps场景设计，支持DAG编排和GitOps自动化部署。

Stars: ⭐️ 16.8k
Tags: MLOps Kubernetes Workflow
最后活动时间: 2026-06-11

apisix

云原生API网关和AI网关，支持流量管理、负载均衡和服务网格，为AI应用提供高性能的流量编排能力。

Stars: ⭐️ 16.7k
Tags: api-gateway ai-gateway kubernetes cloud-native
最后活动时间: 2026-06-12

dagger

强大的自动化引擎，支持本地、CI和云端运行，可用于构建、测试和部署AI项目工作流。

Stars: ⭐️ 15.9k
Tags: CI/CD Automation DevOps AI Agents
最后活动时间: 2026-05-29

self-hosted-ai-starter-kit

n8n打造的开源自托管AI入门套件，提供完整工具链，帮助快速搭建安全、自主可控的本地AI环境。

Stars: ⭐️ 15.0k
Tags: Self-hosted AI Agents Low-code
最后活动时间: 2026-01-06

pyodide

基于WebAssembly的浏览器端Python运行环境，支持在浏览器中运行NumPy、pandas、scikit-learn等科学计算和机器学习库。

Stars: ⭐️ 14.6k
Tags: webassembly python browser machine-learning
最后活动时间: 2026-06-12

OpenMetadata

统一元数据管理平台，支持数据发现与治理，内置MCP服务器可与AI助手无缝集成。

Stars: ⭐️ 14.2k
Tags: Metadata Data Governance MCP Server
最后活动时间: 2026-06-12

trino

分布式SQL查询引擎，专为大数据分析设计，支持多种数据源的高性能查询。

Stars: ⭐️ 12.9k
Tags: big-data sql query-engine distributed-systems data-lake
最后活动时间: 2026-06-12

ubicloud

开源的AWS替代方案，提供弹性计算、块存储、K8s、AI推理服务等完整的云基础设施服务。

Stars: ⭐️ 12.1k
Tags: cloud kubernetes ai-inference open-source
最后活动时间: 2026-06-12

kubeshark

Kubernetes集群网络可观测性工具，使用eBPF捕获流量，支持AI代理通过MCP协议访问。

Stars: ⭐️ 12.0k
Tags: kubernetes network-observability ebpf mcp devops
最后活动时间: 2026-06-03

keep

开源的AIOps和告警管理平台，利用AI技术实现智能运维、告警去重、根因分析和自动化工作流编排。

Stars: ⭐️ 11.9k
Tags: AIOps Alert Management DevOps Workflow Automation
最后活动时间: 2026-06-11

umbrel

优雅的家庭服务器操作系统，支持一键部署 OpenClaw、比特币节点等 300+ 应用，实现真正的自托管 AI 和去中心化服务。

Stars: ⭐️ 11.3k
Tags: self-hosted home-server docker raspberry-pi bitcoin openclaw
最后活动时间: 2026-05-12

OpenSandbox

通用AI应用沙箱平台，提供多语言SDK和Docker/K8s运行时，支持Coding Agent、代码执行和RL训练场景。

Stars: ⭐️ 10.9k
Tags: Sandbox AI Infrastructure Kubernetes
最后活动时间: 2026-05-29

skypilot

统一AI基础设施管理平台，支持跨云GPU/TPU调度、成本优化和分布式训练推理。

Stars: ⭐️ 10.1k
Tags: GPU Management Cloud Infrastructure Distributed Training
最后活动时间: 2026-06-12

3FS

专为AI训练和推理工作负载设计的高性能分布式文件系统，解决大规模AI计算中的存储挑战。

Stars: ⭐️ 10.0k
Tags: Distributed Storage AI Infrastructure High Performance
最后活动时间: 2026-05-07

moltworker

在Cloudflare Workers无服务器平台上运行OpenClaw AI Agent的轻量级云端部署方案。

Stars: ⭐️ 9.9k
Tags: Serverless Cloudflare AI Agents
最后活动时间: 2026-05-09

risingwave

面向智能体AI的事件流平台，支持实时数据摄取、转换和服务，可大规模运行。

Stars: ⭐️ 9.1k
Tags: event-streaming kafka rust stream-processing ai-infrastructure
最后活动时间: 2026-06-12

delta

开源存储框架，支持构建Lakehouse架构，广泛应用于AI/ML数据管道和大规模数据分析场景。

Stars: ⭐️ 8.8k
Tags: delta-lake big-data analytics data-lakehouse spark
最后活动时间: 2026-05-28

mage-ai

现代化的数据管道构建与管理平台，支持ETL/ELT与机器学习数据准备。

Stars: ⭐️ 8.8k
Tags: data-pipelines etl data-engineering orchestration
最后活动时间: 2026-06-09

beam

Apache Beam是统一的批处理和流式数据处理编程模型，广泛用于机器学习数据管道和大规模数据处理。

Stars: ⭐️ 8.6k
Tags: apache-beam data-processing ml-pipelines streaming
最后活动时间: 2026-06-12

docker-stacks

开箱即用的Jupyter Docker镜像集合，为AI/ML开发和数据科学提供完整的容器化开发环境。

Stars: ⭐️ 8.4k
Tags: jupyter docker python machine-learning data-science
最后活动时间: 2026-05-25

jupyterhub

Jupyter笔记本多用户服务器，为团队提供共享的AI/ML开发环境。

Stars: ⭐️ 8.3k
Tags: jupyter jupyterhub multi-user notebook
最后活动时间: 2026-06-10

higress

AI原生API网关，专为AI应用设计的云原生网关解决方案，支持AI流量管理与路由。

Stars: ⭐️ 8.2k
Tags: ai-gateway api-gateway cloud-native envoy
最后活动时间: 2026-04-21

datahaven

Datahaven 是一个兼容 EVM 的 Substrate 区块链，利用 EigenLayer 安全机制为 AI agents 提供去中心化存储基础设施。

Stars: ⭐️ 7.9k
Tags: blockchain storage ai-agents privacy
最后活动时间: 2026-04-17

coroot

开源APM可观测性工具，集成AI驱动的根因分析能力，结合指标、日志、链路追踪和持续性能分析。

Stars: ⭐️ 7.7k
Tags: APM Root Cause Analysis Observability eBPF
最后活动时间: 2026-06-11

AIInfra

AI基础设施资源合集，涵盖从底层芯片到软件栈的AI大模型训练与推理系统知识。

Stars: ⭐️ 7.3k
Tags: ai-infrastructure ai-system training inference
最后活动时间: 2025-12-22

hertzbeat

AI驱动的新一代开源实时可观测性系统，支持监控、告警和LLM增强分析。

Stars: ⭐️ 7.3k
Tags: Observability Monitoring LLM Alerting
最后活动时间: 2026-06-10

feast

开源AI/ML特征存储平台，管理机器学习特征的生命周期，支持实时和批处理特征服务。

Stars: ⭐️ 7.1k
Tags: Feature Store MLOps Machine Learning
最后活动时间: 2026-06-11

flower

友好的联邦学习框架，支持跨设备分布式 AI 模型训练，兼容 PyTorch、TensorFlow 等多种深度学习框架。

Stars: ⭐️ 6.9k
Tags: Federated Learning Distributed Training Privacy Framework
最后活动时间: 2026-06-12

Agent Starter Pack

生产级 AI 智能体部署模板，几分钟内部署到 Google Cloud，内置 CI/CD、评估和可观测性。

Stars: ⭐️ 6.5k
Tags: AI Agents GCP CI/CD Observability
最后活动时间: 2026-06-11

pixie

Kubernetes原生应用可观测性平台，使用eBPF技术实现零侵入监控，内置机器学习分析能力。

Stars: ⭐️ 6.5k
Tags: kubernetes observability ebpf machine-learning monitoring
最后活动时间: 2026-06-10

materialize

面向AI代理的实时数据层，支持SQL创建即时业务视图和流数据处理

Stars: ⭐️ 6.3k
Tags: database streaming sql real-time data-stream
最后活动时间: 2026-05-29

CubeSandbox

为AI智能体设计的即时、并发、安全、轻量级沙箱环境。

Stars: ⭐️ 6.3k
Tags: sandbox ai-agents container security
最后活动时间: 2026-06-12

deepo

一键部署深度学习开发环境，Docker镜像支持主流框架如TensorFlow、PyTorch等。

Stars: ⭐️ 6.3k
Tags: Docker Deep Learning Environment
最后活动时间: 2026-03-25

volcano

CNCF云原生批处理系统，专为AI/ML工作负载设计，支持Kubernetes上的大规模训练和推理任务调度。

Stars: ⭐️ 5.7k
Tags: kubernetes machine-learning batch-systems ai-training
最后活动时间: 2026-06-12

cubefs

云原生分布式存储系统，专为AI场景优化的存储解决方案，支持对象存储和Kubernetes集成。

Stars: ⭐️ 5.6k
Tags: cloud-native-storage ai-native-storage kubernetes distributed-storage
最后活动时间: 2026-06-11

rivet

专为AI智能体和协作应用设计的有状态Actor运行时基础设施。

Stars: ⭐️ 5.6k
Tags: actor-model ai-infrastructure stateful
最后活动时间: 2026-06-12

firebase-js-sdk

Firebase官方JavaScript SDK，提供实时数据库、身份验证、云存储等后端服务，适合构建AI应用的云端基础设施。

Stars: ⭐️ 5.1k
Tags: firebase real-time cloud sdk backend
最后活动时间: 2026-06-11

spack

支持多版本、多平台、多编译器的灵活包管理器，广泛应用于HPC和科学计算环境，适合管理AI/ML依赖。

Stars: ⭐️ 5.1k
Tags: package-manager hpc scientific-computing python
最后活动时间: 2026-06-11

cube-studio

开源云原生一站式机器学习平台，支持 MLOps 全流程、大模型微调训练、多机推理部署及国产算力生态。

Stars: ⭐️ 5.1k
Tags: MLOps Kubernetes 大模型训练 分布式推理
最后活动时间: 2026-06-10

tau

面向人类与机器的全栈工作空间平台，支持云原生、分布式系统和AI工作负载。

Stars: ⭐️ 5.0k
Tags: ai cloud-native distributed-systems serverless webassembly
最后活动时间: 2026-05-07

Olares

开源个人云平台，帮助用户重新掌控自己的数据。支持本地AI模型部署和智能家居集成，提供完整的私有云解决方案。

Stars: ⭐️ 4.7k
Tags: ai-agents local-ai self-hosted home-cloud
最后活动时间: 2026-06-12

nvidia-container-toolkit

NVIDIA容器工具包，支持在容器环境中高效利用GPU资源进行AI训练和推理。

Stars: ⭐️ 4.4k
Tags: docker gpu container nvidia
最后活动时间: 2026-05-28

oracle-ai-developer-hub

Oracle AI开发者技术资源中心，提供构建AI应用、智能体和RAG系统的完整指南，涵盖Oracle AI数据库与OCI云服务的实战示例。

Stars: ⭐️ 4.2k
Tags: oracle ai agents rag kubernetes cloud
最后活动时间: 2026-06-11

pipelines

Kubernetes 原生的机器学习工作流编排平台，提供可视化界面和 SDK，大幅简化 MLOps 实践和 ML 流水线管理。

Stars: ⭐️ 4.2k
Tags: Kubeflow MLOps Kubernetes Pipeline
最后活动时间: 2026-06-11

deepflow

基于eBPF的零侵入式可观测性平台，支持分布式追踪和性能分析，可监控Kubernetes环境下的LLM应用和GPU工作负载。

Stars: ⭐️ 4.1k
Tags: eBPF Observability Kubernetes LLM Monitoring
最后活动时间: 2026-06-12

aws-sdk-pandas

AWS官方pandas集成库，轻松连接Athena、Redshift、S3等AWS数据服务，简化云端数据处理。

Stars: ⭐️ 4.1k
Tags: aws pandas data-engineering etl python
最后活动时间: 2026-06-11

octelium

新一代开源零信任安全访问平台，支持AI/MCP网关、VPN、PaaS等多种部署模式。

Stars: ⭐️ 3.9k
Tags: Zero Trust AI Gateway VPN
最后活动时间: 2026-06-11

ChatGPT-Telegram-Workers

轻松部署Telegram ChatGPT机器人，支持Cloudflare Workers、Vercel和Docker多平台无服务器部署。

Stars: ⭐️ 3.8k
Tags: ChatGPT Telegram Serverless
最后活动时间: 2026-04-06

polyaxon

MLOps平台，提供机器学习全生命周期的管理与编排工具，支持Kubernetes部署。

Stars: ⭐️ 3.7k
Tags: MLOps Kubernetes Machine-Learning
最后活动时间: 2026-06-12

pinme

一键部署前端应用工具，支持Claude Code Skills集成，零配置静态站点托管。

Stars: ⭐️ 3.7k
Tags: deployment frontend claude-code-skill serverless hosting
最后活动时间: 2026-06-04

swarmpit

轻量级 Docker Swarm 管理平台，支持 AI 友好部署和 MCP 协议集成，提供移动端适配的 PWA 界面。

Stars: ⭐️ 3.4k
Tags: docker docker-swarm mcp container-management
最后活动时间: 2026-05-14

dagu

本地优先的工作流引擎，支持声明式、基于文件的配置，可从单机扩展到分布式集群，适用于AI工作流编排。

Stars: ⭐️ 3.3k
Tags: workflow-engine dag job-scheduler ai-workflow
最后活动时间: 2026-04-24

spark-operator

undefined

Stars: ⭐️ 3.1k
Tags: apache-spark kubernetes kubernetes-operator machine-learning
最后活动时间: 2026-06-09

peerdb

高效的数据复制工具，支持从 Postgres 实时同步数据到数据仓库、消息队列和存储系统，为 AI/ML 数据管道提供可靠的基础设施。

Stars: ⭐️ 3.1k
Tags: postgres cdc etl data-pipeline realtime
最后活动时间: 2026-05-28

harbor

一键部署完整LLM技术栈，集成数百个AI服务，支持Docker容器化本地自托管。

Stars: ⭐️ 3.1k
Tags: Docker LLM Self-hosted
最后活动时间: 2026-06-09

heavydb

GPU加速的SQL数据库，支持实时分析和机器学习工作负载。

Stars: ⭐️ 3.1k
Tags: cuda gpu-database sql analytics machine-learning
最后活动时间: 2026-06-11

robusta

Kubernetes智能告警平台，提供AI增强的告警分组、自动修复和故障诊断能力。

Stars: ⭐️ 3.0k
Tags: Kubernetes Prometheus AIOps Monitoring
最后活动时间: 2026-06-11

gravitino

强大的开源数据目录系统，支持构建高性能、地理分布式的联邦元数据湖和AI模型目录管理。

Stars: ⭐️ 2.9k
Tags: Data Catalog Lakehouse Metadata AI Catalog
最后活动时间: 2026-04-24

cloudpods

开源云原生融合云平台，支持多云、私有云和裸金属统一管理，提供完整的IaaS基础设施解决方案。

Stars: ⭐️ 2.9k
Tags: multi-cloud kubernetes hybridcloud infrastructure
最后活动时间: 2026-06-12

kite

轻量级Kubernetes仪表板，整合多集群管理、企业级用户治理和AI智能体于一体的平台级解决方案。

Stars: ⭐️ 2.8k
Tags: kubernetes ai-agent dashboard multi-cluster
最后活动时间: 2026-06-10

gpu-operator

NVIDIA官方Kubernetes GPU运算符，自动化管理集群中的GPU资源配置与调度。

Stars: ⭐️ 2.7k
Tags: kubernetes gpu nvidia cuda
最后活动时间: 2026-06-12

docker-python

Kaggle官方Python Docker镜像，预装常用机器学习与数据科学库。

Stars: ⭐️ 2.7k
Tags: docker kaggle ml-environment data-science
最后活动时间: 2026-05-25

chdb

基于ClickHouse的进程内OLAP SQL引擎，支持高性能数据分析。

Stars: ⭐️ 2.7k
Tags: clickhouse olap sql data-science
最后活动时间: 2026-06-10

amazon-bedrock-agentcore-samples

帮助开发者将AI智能体快速部署到生产环境，提供企业级扩展性、可靠性和安全性支持。

Stars: ⭐️ 2.7k
Tags: AI Agents Production Deployment AWS Bedrock
最后活动时间: 2026-04-23

nono

内核级AI智能体沙箱安全工具，提供能力隔离、安全密钥管理和不可变审计链，防范提示注入等安全威胁。

Stars: ⭐️ 2.7k
Tags: Agent Security Sandbox Zero-Trust
最后活动时间: 2026-06-11

kuberay

在Kubernetes上运行Ray应用的工具包，支持分布式机器学习与深度学习工作负载。

Stars: ⭐️ 2.5k
Tags: kubernetes ray deep-learning machine-learning
最后活动时间: 2026-06-11

hivemind

PyTorch 去中心化深度学习框架，支持全球志愿者协同训练模型。

Stars: ⭐️ 2.5k
Tags: distributed-training decentralized pytorch
最后活动时间: 2026-01-11

awesome-argo

Argo生态系统精选资源列表，涵盖Argo Workflows、ArgoCD等云原生工具，支持MLOps和机器学习工作流编排。

Stars: ⭐️ 2.4k
Tags: argo argocd kubernetes mlops gitops workflow-orchestration
最后活动时间: 2026-02-28

boinc

开源分布式计算平台，支持志愿计算和网格计算，可用于AI模型训练和科学计算任务的大规模分布式处理。

Stars: ⭐️ 2.4k
Tags: distributed-computing volunteer-computing grid-computing high-performance-computing
最后活动时间: 2026-06-12

sedona

大规模地理空间数据处理集群计算框架，支持空间SQL查询和分析，适用于AI地理空间应用的数据预处理管道。

Stars: ⭐️ 2.3k
Tags: geospatial cluster-computing spatial-analysis spatial-query
最后活动时间: 2026-06-12

1backend

企业级微服务平台，支持快速构建和部署 AI 应用，提供私有化部署能力。

Stars: ⭐️ 2.3k
Tags: ai-platform microservices backend self-hosted
最后活动时间: 2026-05-27

sagemaker-python-sdk

AWS SageMaker官方Python SDK，支持在云端训练和部署机器学习模型。

Stars: ⭐️ 2.2k
Tags: aws sagemaker model-deployment
最后活动时间: 2026-06-11

forkd

专为AI智能体设计的微VM沙箱隔离方案，可在101毫秒内从预热父进程快速分叉创建安全隔离环境。

Stars: ⭐️ 2.2k
Tags: ai-agents sandbox microvm kvm
最后活动时间: 2026-06-11

proton

高性能单二进制SQL ETL管道，专为流处理、可观测性分析和AI/ML数据管道设计。

Stars: ⭐️ 2.2k
Tags: etl stream-processing sql real-time data-pipeline
最后活动时间: 2026-06-11

cube-studio

开源云原生一站式机器学习平台，支持大模型训练推理、MLOps全流程、多机分布式训练及国产算力调度。

Stars: ⭐️ 2.2k
Tags: mlops machine-learning-platform kubernetes llm-training
最后活动时间: 2026-05-27

radar

开源Kubernetes可视化UI工具，支持拓扑视图、事件时间线和服务流量监控，集成MCP服务器便于AI助手管理集群。

Stars: ⭐️ 2.2k
Tags: kubernetes k8s mcp-server gitops dashboard
最后活动时间: 2026-05-28

fugue

分布式计算统一接口，支持在Spark、Dask和Ray上无缝执行SQL、Python、Pandas和Polars代码，无需重写。

Stars: ⭐️ 2.2k
Tags: distributed-computing spark dask ray machine-learning
最后活动时间: 2026-05-19

cloudflare-ai-web

Cloudflare AI平台一键部署方案，快速搭建AI应用服务。

Stars: ⭐️ 2.2k
Tags: cloudflare ai-deployment serverless workers-ai nextjs
最后活动时间: 2026-04-25

fusio

面向开发者的自托管 API 管理平台，支持 MCP 服务器和 AI Agent 集成。

Stars: ⭐️ 2.1k
Tags: api-gateway api-management mcp-server self-hosted
最后活动时间: 2026-06-04

datafusion-ballista

Apache DataFusion分布式查询引擎，支持大规模数据处理。适用于AI数据预处理和分析场景。

Stars: ⭐️ 2.1k
Tags: arrow distributed query-engine dataframe
最后活动时间: 2026-06-12

TileDB

通用存储引擎，支持密集和稀疏数组数据，适用于科学计算和AI数据管理。

Stars: ⭐️ 2.1k
Tags: storage-engine arrays data-science scientific-computing database
最后活动时间: 2026-05-26

bytewax

基于Python的流式数据处理框架，专为机器学习数据管道设计，支持实时数据处理。

Stars: ⭐️ 2.0k
Tags: Stream Processing Python ML Pipeline
最后活动时间: 2026-06-11

openmeter

专为 AI 和 API 设计的实时用量计量与计费平台，支持百万级事件的实时聚合与基于用量的计费。

Stars: ⭐️ 2.0k
Tags: metering billing ai-usage usage-based-billing
最后活动时间: 2026-05-28

terraform-skill

Claude Agent 的 Terraform 和 OpenTofu 技能扩展，支持测试、模块管理和生产级最佳实践。

Stars: ⭐️ 2.0k
Tags: Claude Terraform Infrastructure DevOps
最后活动时间: 2026-06-03

Bytez

全球最大无服务器模型推理API平台，提供220,000+AI模型统一访问接口，一键调用主流大模型。

Stars: ⭐️ 2.0k
Tags: API平台 无服务器 模型推理
最后活动时间: 2026-03-03

SREWorks

云原生数智运维平台，集成AIOps与DataOps能力，提供智能运维解决方案。

Stars: ⭐️ 2.0k
Tags: aiops kubernetes devops cloudnative sre
最后活动时间: 2025-12-13

fluid

CNCF项目，为云原生大数据/AI应用提供数据抽象与加速，支持Kubernetes环境下的分布式缓存。

Stars: ⭐️ 1.9k
Tags: kubernetes data-abstraction distributed-cache cncf ai-infrastructure
最后活动时间: 2026-05-28

feldera

增量计算引擎，支持SQL查询和实时数据管道，适用于AI数据预处理和流式计算场景。

Stars: ⭐️ 1.9k
Tags: data-pipelines streaming sql incremental-computation rust
最后活动时间: 2026-05-29

kubewall

单二进制 Kubernetes 仪表板，支持多集群管理与 AI 集成，为 Kubernetes 运维提供智能辅助。

Stars: ⭐️ 1.9k
Tags: Kubernetes AI Dashboard
最后活动时间: 2026-05-19

awesome-spark

Apache Spark资源精选列表，包含MLlib机器学习库，是大规模数据处理和机器学习管道的重要基础设施。

Stars: ⭐️ 1.9k
Tags: apache-spark pyspark machine-learning big-data
最后活动时间: 2026-02-27

aistore

专为AI应用设计的可扩展分布式存储系统，支持Kubernetes部署和ML训练工作负载，提供高性能对象存储和ETL卸载能力。

Stars: ⭐️ 1.9k
Tags: AI Storage Kubernetes Distributed
最后活动时间: 2026-05-28

agent-safehouse

为本地AI代理提供沙箱安全隔离环境，限制其仅能读写必要的文件和资源，保护系统安全。

Stars: ⭐️ 1.9k
Tags: AI代理 沙箱安全 安全隔离
最后活动时间: 2026-05-20

plik

轻量级临时文件上传系统，支持端到端加密，可自托管，已集成MCP协议支持AI助手直接操作文件。

Stars: ⭐️ 1.8k
Tags: file-sharing self-hosted mcp e2ee
最后活动时间: 2026-05-25

repo2docker

将Git仓库自动转换为Jupyter就绪的Docker镜像，简化数据科学和机器学习环境的部署流程。

Stars: ⭐️ 1.7k
Tags: docker jupyter data-science reproducibility
最后活动时间: 2026-05-18

zero-to-jupyterhub-k8s

在Kubernetes上部署JupyterHub的官方Helm Chart，为AI/ML开发提供云端笔记本环境。

Stars: ⭐️ 1.7k
Tags: jupyterhub kubernetes data-science
最后活动时间: 2026-06-10

koordinator

基于QoS的Kubernetes调度系统，为微服务、大数据和AI作业提供最优的资源分配和调度策略。

Stars: ⭐️ 1.7k
Tags: kubernetes scheduling AI-workloads resource-management
最后活动时间: 2026-06-12

distributed

Dask分布式任务调度器，为大规模机器学习和数据处理提供强大的分布式计算能力。

Stars: ⭐️ 1.7k
Tags: distributed-computing dask pydata python
最后活动时间: 2026-06-11

agent-vault

专为AI代理设计的HTTP凭证代理与密钥保险库，安全管理代理认证凭据。

Stars: ⭐️ 1.6k
Tags: ai-agents secrets-management agents
最后活动时间: 2026-06-09

robustmq

下一代统一通信基础设施，专为AI、物联网和大数据场景设计的高性能消息队列系统，支持MQTT、AMQP等多种协议。

Stars: ⭐️ 1.6k
Tags: 消息队列 MQTT Rust AI基础设施
最后活动时间: 2026-06-11

hash

开源多租户平台，支持自建知识图谱与仿真模拟。

Stars: ⭐️ 1.6k
Tags: knowledge-graph simulation rust multi-tenant
最后活动时间: 2026-06-12

quix-streams

基于Kafka的Python流式DataFrame库，适用于实时机器学习数据处理管道。

Stars: ⭐️ 1.6k
Tags: kafka stream-processing python real-time-data
最后活动时间: 2026-06-11

semaphore

专为AI驱动开发打造的一体化持续交付平台，支持构建、测试和部署AI应用。

Stars: ⭐️ 1.5k
Tags: ci-cd continuous-delivery ai-development devops
最后活动时间: 2026-06-12

nixopus

完全代理式的生产应用部署平台，让你无需考虑基础设施即可在自有或共享服务器上运行应用。

Stars: ⭐️ 1.4k
Tags: ai-agents deployment infrastructure mcp self-hosted
最后活动时间: 2026-05-16

app-platform

大模型应用工程平台，集成声明式编程和低代码配置工具。

Stars: ⭐️ 1.4k
Tags: ai agent agentic-ai java low-code
最后活动时间: 2026-05-18

bittensor

去中心化AI网络协议，结合区块链技术实现互联网规模的神经网络协作训练与推理。

Stars: ⭐️ 1.4k
Tags: decentralized-ai blockchain p2p
最后活动时间: 2026-04-23

AI-Horde

众包分布式AI计算集群，支持AI图像和文本生成的志愿者计算网络。

Stars: ⭐️ 1.4k
Tags: distributed-computing stable-diffusion gpt volunteer-computing
最后活动时间: 2026-05-10

gloo

PyTorch官方的分布式训练集合通信库，支持多机多卡训练。

Stars: ⭐️ 1.4k
Tags: distributed-training collectives pytorch multi-machine
最后活动时间: 2026-04-21

oracle-db-examples

Oracle AI 数据库代码示例集合，展示如何在 Oracle 数据库中使用 AI 功能，包括向量存储、机器学习等特性。

Stars: ⭐️ 1.4k
Tags: oracle ai-database vector-database machine-learning
最后活动时间: 2026-05-23

aws-genai-llm-chatbot

AWS上的多LLM多RAG聊天机器人部署方案，支持Amazon Bedrock、OpenAI、Anthropic等多种模型，模块化架构易于扩展。

Stars: ⭐️ 1.4k
Tags: AWS LLM RAG Chatbot CDK
最后活动时间: 2026-06-02

terraform-mcp-server

Terraform MCP服务器，为AI智能体提供与Terraform生态系统的无缝集成，支持基础设施即代码开发自动化。

Stars: ⭐️ 1.4k
Tags: mcp terraform infrastructure-as-code ai-agents
最后活动时间: 2026-05-28

ChatGPT-Mirror

一键部署个人ChatGPT镜像站，支持快速搭建和自定义配置，方便区域访问受限用户。

Stars: ⭐️ 1.4k
Tags: chatgpt mirror deployment proxy
最后活动时间: 2026-03-10

generative-ai-use-cases

AWS官方生成式AI业务用例实现方案，涵盖Claude、Llama等模型和RAG技术，帮助企业安全部署AI应用。

Stars: ⭐️ 1.4k
Tags: AWS Generative AI LLM RAG
最后活动时间: 2026-06-10

KAI-Scheduler

开源的 Kubernetes 原生调度器，专为大规模 AI 工作负载设计，支持 GPU 资源优化和分布式训练任务调度。

Stars: ⭐️ 1.3k
Tags: kubernetes ai-scheduler gpu-scheduling machine-learning
最后活动时间: 2026-06-12

kusion

声明式意图驱动的内部开发者平台编排器，支持LLMOps和多云部署的现代化基础设施解决方案。

Stars: ⭐️ 1.3k
Tags: platform-engineering kubernetes llmops cloud-native
最后活动时间: 2026-01-04

gondolin

基于Linux microvm的实验性AI智能体沙箱环境，使用TypeScript控制平面。

Stars: ⭐️ 1.3k
Tags: sandbox microvm agent-security
最后活动时间: 2026-05-19

arkflow

高性能Rust流处理引擎，无缝集成AI能力，支持实时数据处理和智能分析。适用于机器学习数据管道和实时AI推理场景。

Stars: ⭐️ 1.3k
Tags: Rust Stream Processing AI Real-time
最后活动时间: 2026-05-29

aipexbase

AI 原生后端即服务平台，专注前端开发，后端由 AI 自动处理。

Stars: ⭐️ 1.3k
Tags: baas ai-native backend cloud-platform
最后活动时间: 2026-05-27

grafbase

Grafbase GraphQL联邦网关，支持MCP协议，为AI应用提供高性能的GraphQL数据联邦能力。

Stars: ⭐️ 1.2k
Tags: graphql federation mcp rust
最后活动时间: 2026-05-29

Modal云平台的示例代码集合，展示无服务器GPU计算和ML部署。

Stars: ⭐️ 1.2k
Tags: modal serverless gpu cloud pytorch
最后活动时间: 2026-06-11

xorbits

可扩展的Python数据科学与机器学习框架，API兼容且高性能。

Stars: ⭐️ 1.2k
Tags: scalable distributed-systems machine-learning pandas numpy
最后活动时间: 2026-02-14

azure-skills

微软官方Azure代理插件，提供Azure场景的技能和MCP服务器配置。

Stars: ⭐️ 1.2k
Tags: azure mcp agent-skills cloud
最后活动时间: 2026-06-09

E2B Infra

E2B云平台底层基础设施，为AI智能体提供安全的代码执行沙箱环境。

Stars: ⭐️ 1.2k
Tags: Sandbox Cloud MicroVM
最后活动时间: 2026-06-12

deep-learning-containers

AWS官方深度学习容器，一站式AI/ML云端部署解决方案。

Stars: ⭐️ 1.2k
Tags: aws deep-learning containers deployment
最后活动时间: 2026-05-29

wuying-agentbay-sdk

专为AI智能体打造的云端沙箱环境SDK，提供安全隔离的运行环境用于AI代理测试和部署。

Stars: ⭐️ 1.1k
Tags: sandbox ai-agents cloud sdk
最后活动时间: 2026-05-19

targets

R语言函数式声明式工作流管道工具，类似Makefile，支持高性能计算和可重复研究。

Stars: ⭐️ 1.1k
Tags: pipeline workflow r reproducibility data-science
最后活动时间: 2026-05-13

sandbox-sdk

基于Cloudflare边缘网络的沙盒代码执行环境，为AI智能体提供安全隔离的代码解释器。

Stars: ⭐️ 1.0k
Tags: sandbox code-interpreter edge-computing containers
最后活动时间: 2026-06-11

manifests

Kubeflow AI参考平台的部署清单，支持企业级多租户和安全配置，简化机器学习平台在Kubernetes上的部署。

Stars: ⭐️ 1.0k
Tags: kubeflow kubernetes deployment mlops
最后活动时间: 2026-05-27

kaito

Kubernetes AI工具链操作器，简化AI模型在Kubernetes集群上的部署和管理，支持GPU资源调度。

Stars: ⭐️ 948
Tags: kubernetes ai gpu operator mlops
最后活动时间: 2026-05-28

dante-cloud

支持阻塞式和响应式并行的微服务云原生基座，集成Spring AI支持AI Agent开发，满足企业级安全合规要求。

Stars: ⭐️ 943
Tags: microservices spring-ai ai-agent cloud-native
最后活动时间: 2026-06-12

kernel-images

面向自动化和Web智能体的浏览器即服务基础设施。

Stars: ⭐️ 935
Tags: browser-automation infrastructure docker unikernel
最后活动时间: 2026-06-11

vibe

macOS上的轻量级Linux虚拟机工具，用于安全沙箱化运行LLM智能体。

Stars: ⭐️ 918
Tags: Sandbox LLM Agents Virtualization
最后活动时间: 2026-05-09

hera

Python原生集成库，让Python代码轻松编排到Argo Workflows上运行，支持纯Python构建和提交工作流。

Stars: ⭐️ 914
Tags: Argo Workflows Python Kubernetes MLOps
最后活动时间: 2026-06-11

kubectl-mcp-server

Kubernetes MCP服务器，让AI助手能够管理和操作K8s集群。

Stars: ⭐️ 909
Tags: kubernetes mcp mcp-server devops
最后活动时间: 2026-04-08

n8n-install

一键部署自托管AI自动化平台，集成n8n、Ollama、Flowise、RAG等30+工具。

Stars: ⭐️ 886
Tags: Self-hosted Docker Ollama RAG
最后活动时间: 2026-05-17

bacalhau

分布式计算框架，支持AI数据管道、批处理和去中心化计算任务的高效执行平台。

Stars: ⭐️ 862
Tags: distributed-computing ai-pipeline data-processing
最后活动时间: 2026-06-10

covalent

Python工作流编排工具，支持机器学习、高性能计算和量子计算任务的异构环境调度。

Stars: ⭐️ 861
Tags: workflow orchestration machine-learning quantum-computing
最后活动时间: 2026-05-25

data-on-eks

在Amazon EKS上构建、部署和扩展数据与ML平台的工具集，支持Kubeflow、Ray、Spark等框架。

Stars: ⭐️ 849
Tags: kubernetes eks mlflow kubeflow
最后活动时间: 2026-06-10

onyxia

Kubernetes 原生的数据科学开发环境，为 AI/ML 工作负载提供完整的容器化开发平台。

Stars: ⭐️ 840
Tags: kubernetes data-science datalab helm
最后活动时间: 2026-06-11

gcloud-mcp

Google Cloud MCP 服务器，让 AI 智能体能够与 Google Cloud 服务进行交互操作。

Stars: ⭐️ 831
Tags: gcloud mcp google-cloud ai-integration
最后活动时间: 2026-06-11

k8m

轻量级跨平台 Kubernetes AI 管理面板，集成大模型、智能体和MCP支持，提供多集群管理、智能分析和实时异常检测功能。

Stars: ⭐️ 829
Tags: ai kubernetes dashboard mcp llm chatgpt
最后活动时间: 2026-06-04

flake

Nix Flake配置集合，为众多AI项目提供便捷的包管理和开发环境。

Stars: ⭐️ 826
Tags: nix nixos ai flake dev-environment
最后活动时间: 2026-05-09

groundx-on-prem

可Kubernetes部署的文档解析、存储和搜索服务，支持本地化部署。

Stars: ⭐️ 815
Tags: Kubernetes 文档解析 本地部署
最后活动时间: 2026-05-29

arena

Kubeflow命令行工具，简化Kubernetes上的机器学习任务管理，支持一键部署训练任务和模型服务。

Stars: ⭐️ 812
Tags: Kubeflow Kubernetes 深度学习
最后活动时间: 2026-05-07

k7

轻量级虚拟机沙箱基础设施，用于安全执行不可信代码，支持CLI、API和Python SDK，是AI智能体代码执行的安全底座。

Stars: ⭐️ 781
Tags: sandbox agents security virtual-machine
最后活动时间: 2025-12-14

curvine

基于 Rust 构建的高性能分布式多层缓存系统，专为 AI 基础设施优化。

Stars: ⭐️ 764
Tags: ai-infrastructure cache rust distributed-systems
最后活动时间: 2026-05-28

jupyterhub-deploy-docker

JupyterHub 的 Docker 参考部署方案，为数据科学和机器学习团队提供多用户的 Notebook 协作环境。

Stars: ⭐️ 763
Tags: jupyterhub docker data-science machine-learning
最后活动时间: 2026-05-06

oio-sds

高性能软件定义对象存储系统，支持 S3 和 Swift 协议，专为大数据和 AI 工作负载设计。

Stars: ⭐️ 752
Tags: object-storage s3 storage big-data
最后活动时间: 2026-05-07

vertex-ai-samples

Google Cloud Vertex AI官方示例代码库，包含Jupyter notebooks和代码示例，全面演示机器学习和生成式AI工作流开发。

Stars: ⭐️ 737
Tags: vertex-ai gemini generative-ai mlops
最后活动时间: 2026-06-11

helix

专为AI智能体支付设计的自愈基础设施，实现90.3%自动恢复能力。

Stars: ⭐️ 722
Tags: ai-agents payments infrastructure self-healing
最后活动时间: 2026-05-28

heir

基于MLIR的同态加密编译器，支持在加密数据上直接进行计算，为隐私保护的AI推理提供基础设施支持。

Stars: ⭐️ 719
Tags: Homomorphic Encryption MLIR Privacy-Preserving AI
最后活动时间: 2026-04-24

worker-comfyui

将ComfyUI部署为RunPod无服务器API，支持SDXL和Stable Diffusion工作流的云端托管与弹性扩展。

Stars: ⭐️ 704
Tags: ComfyUI Serverless Stable Diffusion
最后活动时间: 2026-06-10

vertex-ai-mlops

Google Cloud Vertex AI 端到端 MLOps 工作流模板，涵盖机器学习模型训练、部署和运维全流程。

Stars: ⭐️ 696
Tags: MLOps Vertex AI GCP Deep Learning
最后活动时间: 2026-06-11

BharatMLStack

开源端到端机器学习基础设施栈，支持实时和批量ML工作负载的大规模部署。

Stars: ⭐️ 693
Tags: ml-infrastructure feature-store mlops machine-learning
最后活动时间: 2026-06-04

mlops-stacks

Databricks ML 项目启动模板，开箱即用的生产级最佳实践配置。

Stars: ⭐️ 687
Tags: databricks mlops machine-learning
最后活动时间: 2026-05-01

enterprise_gateway

轻量级多租户Jupyter网关，支持在Kubernetes、Spark等分布式集群上运行Notebook内核，适用于AI/ML分布式计算场景。

Stars: ⭐️ 666
Tags: jupyter kubernetes distributed-computing spark enterprise-gateway
最后活动时间: 2026-06-01

awesome-kubernetes

Kubernetes与云原生技术资源合集，涵盖AI基础设施、DevOps、可观测性等主题，适合构建AI模型部署平台。

Stars: ⭐️ 663
Tags: kubernetes cloud-native devops infrastructure ai-infrastructure
最后活动时间: 2026-06-11

turbodbc

高性能Python ODBC数据库连接模块，支持NumPy和大数据场景下的快速数据访问。

Stars: ⭐️ 658
Tags: odbc database numpy python data-science
最后活动时间: 2026-06-02

vibe

MacOS上的轻量级Linux虚拟机，专为LLM Agent沙箱隔离设计，保障安全运行环境。

Stars: ⭐️ 653
Tags: Sandbox VM Agent Security
最后活动时间: 2026-06-11

flux-operator

自动化GitOps运维工具，集成MCP服务器支持AI助手进行集群管理和持续交付。

Stars: ⭐️ 648
Tags: gitops fluxcd mcp-server continuous-delivery kubernetes
最后活动时间: 2026-06-10

dify-helm

Dify平台的Kubernetes Helm部署方案，支持在K8s集群中快速部署LLM应用。

Stars: ⭐️ 645
Tags: Kubernetes Helm Dify 部署
最后活动时间: 2026-05-02

vibe

MacOS上的轻量级Linux虚拟机，专为LLM Agent沙箱隔离设计，保障安全运行环境。

Stars: ⭐️ 640
Tags: Sandbox VM Agent Security
最后活动时间: 2026-04-23

mlops-v2

Azure MLOps 企业级解决方案加速器，提供生产就绪的机器学习模型部署模板。

Stars: ⭐️ 635
Tags: azure mlops machine-learning devops
最后活动时间: 2026-06-03

rustunnel

基于Rust的自托管安全隧道服务器，支持MCP协议让AI代理访问本地服务。可通过TLS加密的WebSocket暴露本地HTTP/HTTPS/TCP/UDP服务到公网。

Stars: ⭐️ 634
Tags: tunnel mcp-server self-hosted rust reverse-proxy
最后活动时间: 2026-06-12

deep-learning-frameworks

为ArcGIS系统提供深度学习框架的安装支持与环境配置工具。

Stars: ⭐️ 623
Tags: Deep Learning ArcGIS Infrastructure Installation
最后活动时间: 2026-05-21

cloud-run-mcp

MCP 服务器，支持将 AI 应用一键部署到 Google Cloud Run，简化云端部署流程。

Stars: ⭐️ 615
Tags: mcp mcp-server google-cloud cloud-run
最后活动时间: 2026-06-11

self-host-n8n-on-gcr

在 Google Cloud 上自托管 n8n 的解决方案，支持 AI Agent 工作流的低成本无服务器部署。

Stars: ⭐️ 607
Tags: n8n Self-hosting Google Cloud AI Agents
最后活动时间: 2026-05-13

arc

高性能分析型数据库，基于 DuckDB SQL 引擎和 Parquet 存储，支持 AI、IoT、日志分析等场景，单二进制部署无厂商锁定。

Stars: ⭐️ 607
Tags: DuckDB Parquet OLAP Analytics
最后活动时间: 2026-06-11

venice

LinkedIn开源的衍生数据平台，专为行星级规模工作负载设计，支持AI/ML数据处理与推理场景。

Stars: ⭐️ 604
Tags: ML Platform Data Infrastructure Scalable
最后活动时间: 2026-06-12

kubespawner

JupyterHub的Kubernetes动态Pod生成器，支持为每个用户创建独立的Jupyter Notebook环境，广泛用于数据科学和机器学习工作流。

Stars: ⭐️ 603
Tags: jupyter jupyterhub kubernetes data-science
最后活动时间: 2026-06-01

redun

支持AWS/GCP的数据科学工作流引擎，提供任务调度与Docker容器编排能力。

Stars: ⭐️ 590
Tags: workflow-engine data-engineering etl ml
最后活动时间: 2026-04-16

ollama-helm

用于在Kubernetes集群中部署Ollama的Helm Chart，支持GPU资源配置和模型管理，适合生产环境。

Stars: ⭐️ 583
Tags: Helm Kubernetes LLM部署
最后活动时间: 2026-06-09

matchlock

基于Linux沙箱的AI代理工作负载安全隔离方案，保障AI系统运行环境的安全性。

Stars: ⭐️ 583
Tags: security sandbox ai-agents linux
最后活动时间: 2026-05-19

openclaw-ansible

OpenClaw 自动化部署方案，集成 Tailscale VPN、UFW 防火墙和 Docker 隔离，提供安全加固的一键安装体验。

Stars: ⭐️ 582
Tags: openclaw ansible deployment docker vpn security
最后活动时间: 2026-05-28

Slurm-web

Slurm HPC 和 AI 集群的开源 Web 管理界面，提供可视化监控和管理功能。

Stars: ⭐️ 572
Tags: slurm hpc cluster-management webui
最后活动时间: 2026-05-27

leash

StrongDM推出的AI代理安全沙盒工具，为AI代理提供安全的容器化运行环境。

Stars: ⭐️ 570
Tags: ai-agents sandbox security container
最后活动时间: 2026-04-06

caddy-defender

Caddy 服务器模块，用于阻止或干扰 AI 爬虫对网站内容的抓取训练，保护原创内容安全。

Stars: ⭐️ 557
Tags: caddy ai-blocker security web-security
最后活动时间: 2026-06-08

databricks-sdk-py

Databricks官方Python SDK，用于在Databricks数据智能平台上构建AI和机器学习应用。

Stars: ⭐️ 550
Tags: databricks sdk python machine-learning
最后活动时间: 2026-05-28

cloud-code

在Cloudflare上运行OpenCode，构建专属云端AI代理的轻量级解决方案。

Stars: ⭐️ 546
Tags: cloudflare opencode cloud-agent serverless
最后活动时间: 2026-01-29

code-on-incus

为AI Agent提供隔离的沙箱环境，支持root权限、Docker和systemd，内置主动防御机制自动检测并阻止威胁。

Stars: ⭐️ 541
Tags: ai-sandbox llm-security container-security agentic-ai code-sandbox
最后活动时间: 2026-06-12

generative-ai-cdk-constructs

AWS官方提供的生成式AI CDK构造库，包含RAG、Agent、知识库等常见GenAI架构模式的示例实现。

Stars: ⭐️ 539
Tags: AWS CDK GenAI RAG
最后活动时间: 2026-06-12

codalab-competitions

机器学习竞赛平台，支持基准测试和科学研究竞赛。

Stars: ⭐️ 537
Tags: ml-competitions benchmarks machine-learning-platform
最后活动时间: 2026-04-28

sagemaker-training-toolkit

AWS SageMaker官方训练工具包，支持在Docker容器中训练机器学习模型。

Stars: ⭐️ 536
Tags: aws sagemaker machine-learning training docker
最后活动时间: 2026-01-16

unbody

AI 时代的模块化后端平台，专为构建知识驱动的 AI 原生应用设计。

Stars: ⭐️ 528
Tags: ai-backend knowledge-base vector-database rag
最后活动时间: 2026-04-14

mpi-operator

Kubernetes上运行MPI分布式训练应用的Operator，支持PyTorch和TensorFlow。

Stars: ⭐️ 528
Tags: kubernetes distributed-training mpi kubeflow
最后活动时间: 2026-06-02

examples

Cerebrium无服务器GPU平台示例代码，涵盖LLM、ML模型部署实践。

Stars: ⭐️ 523
Tags: serverless-gpu llm-deployment mlops ai-inference
最后活动时间: 2026-05-08

ml-on-gcp

Google Cloud平台上的机器学习示例集合，涵盖ML工作流的完整实践指南。

Stars: ⭐️ 515
Tags: GCP Machine Learning Cloud
最后活动时间: 2026-05-19

fullstack-solution-template-for-agentcore

用于Amazon Bedrock AgentCore的生产级全栈解决方案模板，支持快速部署各类AI代理应用场景。

Stars: ⭐️ 514
Tags: agent agentcore aws bedrock fullstack deployment
最后活动时间: 2026-06-12

dxos

去中心化协议与SDK的TypeScript实现，支持CRDT数据库和P2P通信，可作为AI应用的去中心化基础设施。

Stars: ⭐️ 507
Tags: ai crdt database decentralized p2p
最后活动时间: 2026-06-12

openclaw-billing-proxy

OpenClaw API 计费代理，支持通过 Claude Code 订阅计费路由请求。

Stars: ⭐️ 506
Tags: openclaw billing api-proxy claude
最后活动时间: 2026-04-10

Hardware Acceleration

ColossalAI

大规模并行训练框架，让大模型训练更便宜、更快速。支持多种并行策略和异构训练，显著降低开发门槛。

Stars: ⭐️ 41.4k
Tags: Distributed Training LLM Deep Learning
最后活动时间: 2026-05-25

jax

Google开源的高性能机器学习框架，支持自动微分、向量化、JIT编译到GPU/TPU，是构建深度学习模型的核心基础设施。

Stars: ⭐️ 35.7k
Tags: jax machine-learning deep-learning gpu autodiff
最后活动时间: 2026-05-29

taichi

高性能GPU编程语言，支持可微分编程，适用于AI计算加速与图形学应用。

Stars: ⭐️ 28.2k
Tags: gpu-programming differentiable-programming high-performance
最后活动时间: 2026-04-06

llmfit

一键检测硬件兼容性，从数百个模型中找到适合本地运行的模型。

Stars: ⭐️ 26.8k
Tags: 硬件适配 模型选择 本地AI
最后活动时间: 2026-05-27

mlx

Apple官方推出的数组计算框架，专为Apple Silicon芯片优化的机器学习基础设施。

Stars: ⭐️ 26.5k
Tags: Apple Silicon ML Framework Hardware Acceleration
最后活动时间: 2026-05-24

modular

Modular平台包含MAX和Mojo编程语言，为AI开发提供高性能基础设施和统一的执行环境。

Stars: ⭐️ 26.3k
Tags: mojo ai-infrastructure programming-language machine-learning max
最后活动时间: 2026-06-11

hashcat

世界最快的高级密码恢复工具，支持GPU加速和多种哈希算法破解。

Stars: ⭐️ 26.0k
Tags: password-recovery gpu-acceleration security cuda opencl
最后活动时间: 2026-02-20

ncnn

专为移动端优化的高性能神经网络推理框架，支持Android、iOS及多种硬件架构。

Stars: ⭐️ 23.4k
Tags: Inference Mobile AI Edge Computing
最后活动时间: 2026-06-08

onnxruntime

微软开源的高性能ML推理和训练加速器，跨平台支持，兼容PyTorch、TensorFlow等主流框架。

Stars: ⭐️ 20.8k
Tags: ONNX Inference Cross-platform Acceleration
最后活动时间: 2026-06-12

airllm

在单张4GB GPU上运行70B大语言模型的推理优化方案，突破显存限制。

Stars: ⭐️ 19.8k
Tags: LLM Inference GPU Optimization Model Serving
最后活动时间: 2026-03-10

ktransformers

一个灵活的异构LLM推理与微调优化框架，支持多种硬件加速方案，帮助开发者在不同设备上高效运行大模型。

Stars: ⭐️ 17.2k
Tags: LLM Inference Hardware Optimization Fine-tuning
最后活动时间: 2026-05-21

codon

高性能零开销Python编译器，内置NumPy支持，可加速AI/ML工作负载。

Stars: ⭐️ 16.8k
Tags: compiler python numpy high-performance gpu-programming
最后活动时间: 2026-05-27

MNN

阿里巴巴开源的高性能轻量级推理引擎，支持端侧LLM与边缘AI。

Stars: ⭐️ 15.5k
Tags: Inference Edge AI Embedded
最后活动时间: 2026-06-12

ggml

专为边缘设备优化的张量计算库，支持在CPU和Apple Silicon上高效运行大语言模型，是llama.cpp等项目的核心依赖。

Stars: ⭐️ 14.8k
Tags: Tensor Library Edge AI LLM Inference
最后活动时间: 2026-06-11

ZLUDA

在非NVIDIA GPU上运行CUDA程序的项目，让AMD等显卡也能执行CUDA加速的AI训练和推理任务。

Stars: ⭐️ 14.3k
Tags: cuda gpu rust hardware-acceleration
最后活动时间: 2026-06-08

TensorRT-LLM

NVIDIA官方LLM推理优化库，支持在GPU上高效运行大语言模型，包含先进的优化技术。

Stars: ⭐️ 13.9k
Tags: LLM Inference NVIDIA GPU
最后活动时间: 2026-06-12

dask

灵活的并行计算库，为NumPy、Pandas和scikit-learn提供大规模数据处理能力，是机器学习工作流的重要基础设施。

Stars: ⭐️ 13.8k
Tags: parallel-computing numpy pandas scikit-learn
最后活动时间: 2026-06-11

TensorRT

NVIDIA官方高性能深度学习推理SDK，专为GPU加速优化，支持模型部署与推理加速。

Stars: ⭐️ 13.1k
Tags: Deep Learning Inference GPU NVIDIA
最后活动时间: 2026-06-03

FlashMLA

高效的多头潜在注意力内核，优化LLM推理性能的关键组件。

Stars: ⭐️ 12.7k
Tags: attention llm optimization kernels
最后活动时间: 2026-04-30

LeetCUDA

现代CUDA学习笔记，包含200+ CUDA内核、Tensor Cores与Flash Attention实现。

Stars: ⭐️ 11.1k
Tags: cuda gpu flash-attention
最后活动时间: 2026-05-29

numba

基于LLVM的Python动态编译器，支持CUDA GPU加速，让Python代码获得接近C的性能。

Stars: ⭐️ 11.0k
Tags: cuda gpu compiler python llvm numpy
最后活动时间: 2026-06-11

cupy

GPU加速的NumPy与SciPy替代库，为AI/ML计算提供高性能CUDA加速支持。

Stars: ⭐️ 11.0k
Tags: gpu cuda numpy scipy deep-learning
最后活动时间: 2026-06-11

nvtop

类似 htop 的 GPU 进程监控工具，支持 NVIDIA、AMD、Intel、Apple 等多厂商 GPU。AI 从业者必备的系统监控利器，实时查看显存和计算资源占用。

Stars: ⭐️ 10.7k
Tags: gpu monitoring nvidia amd terminal
最后活动时间: 2026-05-06

xformers

Meta开源的可扩展Transformer优化库，提供高效内存优化的注意力机制实现，显著提升大模型训练和推理效率。

Stars: ⭐️ 10.5k
Tags: transformers optimization memory-efficient attention
最后活动时间: 2026-05-21

cutlass

NVIDIA开源的高性能CUDA模板库，专为深度学习线性代数运算优化，支持Tensor Core加速。

Stars: ⭐️ 9.9k
Tags: cuda deep-learning gpu nvidia linear-algebra
最后活动时间: 2026-06-11

accelerate

Hugging Face 出品的 PyTorch 加速库，支持多设备训练、分布式配置、混合精度训练和 FSDP/DeepSpeed，让模型训练更简单高效。

Stars: ⭐️ 9.7k
Tags: PyTorch Distributed Training Mixed Precision
最后活动时间: 2026-05-28

cudf

NVIDIA RAPIDS生态的GPU DataFrame库，提供类似Pandas的API，实现大规模数据的GPU加速处理。

Stars: ⭐️ 9.7k
Tags: GPU加速 DataFrame RAPIDS
最后活动时间: 2026-06-12

apex

NVIDIA官方PyTorch扩展，提供混合精度训练与分布式训练工具。

Stars: ⭐️ 9.0k
Tags: mixed-precision distributed-training pytorch
最后活动时间: 2026-05-27

ipex-llm

Intel XPU上的LLM推理和微调加速库，支持主流开源模型和多种推理框架集成。

Stars: ⭐️ 8.8k
Tags: LLM Intel Acceleration
最后活动时间: 2026-01-28

OptiScaler

跨GPU的AI超分辨率和帧生成桥接工具，支持DLSS/XeSS/FSR输入转换，让非FG游戏也能使用FSR3帧生成技术。

Stars: ⭐️ 8.5k
Tags: dlss fsr xess upscaling frame-generation gpu
最后活动时间: 2026-05-28

bitsandbytes

PyTorch量化工具库，提供k-bit量化支持，是LLM量化和高效推理的核心依赖库。

Stars: ⭐️ 8.3k
Tags: Quantization PyTorch LLM
最后活动时间: 2026-06-11

tensorrtx

使用TensorRT网络定义API实现主流深度学习网络的高性能推理加速，支持YOLO系列、ResNet、Swin Transformer等热门模型。

Stars: ⭐️ 7.8k
Tags: tensorrt deep-learning inference yolo gpu-acceleration
最后活动时间: 2026-05-20

nvitop

交互式NVIDIA GPU进程监控管理工具，支持Prometheus导出和Grafana仪表板集成。

Stars: ⭐️ 6.9k
Tags: GPU Monitoring NVIDIA DevOps
最后活动时间: 2026-05-25

warp

NVIDIA开发的Python GPU加速框架，支持可微分编程，适用于物理仿真和空间计算。

Stars: ⭐️ 6.7k
Tags: cuda gpu differentiable-programming simulation python
最后活动时间: 2026-06-11

ANE

通过逆向工程在Apple Neural Engine上训练神经网络的实验性项目。

Stars: ⭐️ 6.7k
Tags: apple-neural-engine hardware-acceleration core-ml
最后活动时间: 2026-03-10

ROCm

AMD开源GPU计算平台，为AI/ML工作负载提供高性能硬件加速支持，是NVIDIA CUDA的主要竞争对手。

Stars: ⭐️ 6.4k
Tags: GPU AMD Hardware Acceleration Deep Learning
最后活动时间: 2026-04-23

tilelang

专为高性能GPU/CPU/加速器内核开发设计的领域特定语言，可显著简化AI算子优化流程。

Stars: ⭐️ 6.4k
Tags: dsl gpu kernel high-performance cuda
最后活动时间: 2026-05-29

stable-diffusion.cpp

纯C/C++实现的扩散模型推理框架，支持SD、Flux、Wan等多种模型，无需依赖即可高效运行。

Stars: ⭐️ 6.2k
Tags: C++ Inference Diffusion GGML
最后活动时间: 2026-06-08

mlx-lm

基于Apple MLX框架的大语言模型推理库，专为Apple Silicon芯片优化加速。

Stars: ⭐️ 5.8k
Tags: MLX Apple Silicon LLM
最后活动时间: 2026-06-11

flashinfer

专为LLM推理设计的高性能GPU内核库，支持注意力机制、MoE等关键算子的JIT编译优化。

Stars: ⭐️ 5.8k
Tags: CUDA LLM Inference GPU Kernels Attention
最后活动时间: 2026-06-12

DALI

NVIDIA开发的GPU加速数据处理库，为深度学习训练和推理提供高效的数据管道。

Stars: ⭐️ 5.7k
Tags: deep-learning gpu data-processing image-processing
最后活动时间: 2026-06-11

tpu

Google Cloud TPU官方参考模型和工具集，支持大规模AI模型训练加速。

Stars: ⭐️ 5.3k
Tags: TPU Hardware Google Cloud
最后活动时间: 2026-03-25

rust-cuda

纯Rust编写的CUDA生态系统，支持在Rust中直接编写和执行高性能GPU代码，为AI模型训练和推理提供底层加速支持。

Stars: ⭐️ 5.2k
Tags: cuda gpu rust gpgpu
最后活动时间: 2026-04-29

cuml

NVIDIA RAPIDS机器学习库，提供GPU加速的经典ML算法实现，包括聚类、分类、回归等。

Stars: ⭐️ 5.2k
Tags: cuda machine-learning gpu rapids
最后活动时间: 2026-06-11

gpustack

高性能GPU推理工具，支持vLLM/SGLang等引擎优化，实现卓越的LLM推理吞吐量和资源利用率。

Stars: ⭐️ 5.1k
Tags: GPU Inference vLLM LLM Serving
最后活动时间: 2026-06-12

mlx-vlm

在Mac上使用MLX进行视觉语言模型推理和微调的工具包。支持LLaVA、Florence2、Pixtral等多种VLM模型。

Stars: ⭐️ 5.0k
Tags: MLX Vision Language Apple Silicon
最后活动时间: 2026-06-12

LACT

Linux GPU配置与监控工具，支持AMD和NVIDIA显卡，适用于AI开发者的GPU资源管理与性能调优。

Stars: ⭐️ 4.9k
Tags: gpu nvidia amdgpu linux monitoring
最后活动时间: 2026-06-08

arrayfire

通用GPU计算库，支持CUDA、OpenCL和CPU后端，为AI/ML工作负载提供高性能并行计算能力。

Stars: ⭐️ 4.9k
Tags: GPU CUDA OpenCL HPC
最后活动时间: 2026-03-07

blitzar

基于GPU加速的零知识证明库，支持C++和Rust，可用于隐私保护的机器学习应用。

Stars: ⭐️ 4.9k
Tags: zero-knowledge-proofs gpu-acceleration cryptography
最后活动时间: 2026-06-11

nccl

NVIDIA开源的多GPU集合通信原语库，为深度学习分布式训练提供高效通信支持。

Stars: ⭐️ 4.8k
Tags: cuda gpu distributed-training communication
最后活动时间: 2026-06-12

jetson-containers

为NVIDIA Jetson设备提供开箱即用的机器学习容器镜像，支持PyTorch、TensorFlow等主流框架。

Stars: ⭐️ 4.7k
Tags: NVIDIA Jetson Docker ML Containers
最后活动时间: 2026-05-30

AITemplate

Meta开源的AI推理框架，将神经网络渲染为高性能CUDA/HIP C++代码，专为NVIDIA和AMD GPU推理优化。

Stars: ⭐️ 4.7k
Tags: inference cuda gpu optimization
最后活动时间: 2026-04-09

tiny-cuda-nn

轻量级高性能CUDA神经网络框架，支持实时MLP和NeRF渲染，速度极快。

Stars: ⭐️ 4.5k
Tags: cuda neural-network gpu nerf
最后活动时间: 2026-04-21

hip

AMD开发的C++异构计算接口，实现CUDA代码向AMD GPU的便携式迁移。

Stars: ⭐️ 4.3k
Tags: cuda hip gpu amd heterogeneous-computing
最后活动时间: 2026-05-28

xla

Google开源的机器学习编译器，优化GPU、CPU和ML加速器上的模型执行性能。

Stars: ⭐️ 4.3k
Tags: compiler gpu optimization tensorflow
最后活动时间: 2026-05-29

oneDNN

Intel开源的深度神经网络库，针对多种CPU架构和硬件加速器进行优化，支持AVX512、AMX等指令集。

Stars: ⭐️ 4.0k
Tags: Deep Learning Neural Network Hardware Acceleration
最后活动时间: 2026-06-12

Nunchaku

ICLR2025 Spotlight，面向4-bit扩散模型的量化方法，通过低秩组件吸收异常值实现高效生成。

Stars: ⭐️ 3.8k
Tags: Quantization Diffusion Flux
最后活动时间: 2026-03-07

tvm-cn

TVM深度学习编译器框架的中文文档，涵盖模型优化、跨平台部署和硬件加速等核心内容。

Stars: ⭐️ 3.8k
Tags: deep-learning gpu machine-learning tvm compiler
最后活动时间: 2026-05-20

k8s-device-plugin

NVIDIA官方Kubernetes设备插件，支持在K8s集群中调度和管理GPU资源，是AI/ML工作负载部署的核心基础设施组件。

Stars: ⭐️ 3.8k
Tags: kubernetes nvidia gpu device-plugin
最后活动时间: 2026-06-12

zml

跨平台AI推理框架，支持任意模型和硬件，基于Zig语言构建，实现零妥协的高性能部署。

Stars: ⭐️ 3.6k
Tags: ai inference zig xla hpc
最后活动时间: 2026-06-12

HAMi

Kubernetes异构GPU共享解决方案，支持NVIDIA、华为昇腾、寒武纪等多种GPU的虚拟化与资源调度。

Stars: ⭐️ 3.6k
Tags: kubernetes gpu-virtualization gpu-sharing vgpu
最后活动时间: 2026-06-11

StringZilla

高性能字符串处理库，支持SIMD和GPU加速，提供搜索、哈希、排序、编辑距离计算等功能，速度提升高达100倍。

Stars: ⭐️ 3.5k
Tags: string simd gpu cuda edit-distance search
最后活动时间: 2026-06-11

SageAttention

ICLR2025/ICML2025/NeurIPS2025 Spotlight，量化注意力机制实现2-5倍加速，无损端到端性能。

Stars: ⭐️ 3.4k
Tags: Attention Quantization Acceleration
最后活动时间: 2026-01-17

optimum

Hugging Face官方硬件优化工具包，加速Transformers和Diffusers模型的推理与训练，支持ONNX、量化及多硬件后端。

Stars: ⭐️ 3.4k
Tags: 模型优化 推理加速 量化
最后活动时间: 2026-06-09

TransformerEngine

NVIDIA推出的Transformer模型加速库，支持FP8/FP4低精度训练与推理，显著提升Hopper/Ada/Blackwell GPU性能并降低显存占用。

Stars: ⭐️ 3.4k
Tags: deep-learning gpu cuda pytorch transformers
最后活动时间: 2026-06-11

cuda-python

NVIDIA官方CUDA Python绑定库，让Python开发者能够充分利用GPU并行计算能力，实现高性能计算。

Stars: ⭐️ 3.3k
Tags: cuda gpu python nvidia high-performance
最后活动时间: 2026-05-29

jittor

基于JIT编译和元算子的高性能深度学习框架，提供高效的模型训练与推理能力。

Stars: ⭐️ 3.2k
Tags: deep-learning gpu jit python neural-network
最后活动时间: 2026-06-03

ComputeLibrary

Arm官方推出的计算机视觉与机器学习函数库，针对Arm CPU/GPU进行SIMD优化，支持NEON/SVE指令集。

Stars: ⭐️ 3.2k
Tags: machine-learning computer-vision arm simd neural-network
最后活动时间: 2026-06-11

rust-gpu

让 Rust 成为 GPU 着色器的一等公民，为 AI/ML 计算和图形编程提供安全、高效的 GPU 编程能力。

Stars: ⭐️ 3.1k
Tags: gpu shaders spirv vulkan compute
最后活动时间: 2026-05-20

how-to-optim-algorithm-in-cuda

CUDA算法优化实践指南，涵盖LLM相关算子的GPU加速技巧。

Stars: ⭐️ 3.0k
Tags: CUDA GPU Optimization
最后活动时间: 2026-05-25

ao

PyTorch官方量化和稀疏性优化库，支持float8等现代数据类型，加速训练与推理。

Stars: ⭐️ 2.9k
Tags: 量化 稀疏性 PyTorch
最后活动时间: 2026-06-11

luminal

高性能深度学习框架，追求极致的计算速度优化。

Stars: ⭐️ 2.8k
Tags: deep-learning performance framework
最后活动时间: 2026-05-27

xla

PyTorch XLA扩展，支持在TPU等XLA设备上运行深度学习训练。

Stars: ⭐️ 2.8k
Tags: pytorch tpu xla deep-learning
最后活动时间: 2026-05-27

claude-code-local

在Apple Silicon上本地运行Claude Code，122B模型可达41 tok/s，无需云端和API费用。

Stars: ⭐️ 2.7k
Tags: local-llm apple-silicon claude-code
最后活动时间: 2026-06-05

futhark

一种数据并行函数式编程语言，可将高级代码编译为高性能GPU代码，支持CUDA和OpenCL。

Stars: ⭐️ 2.7k
Tags: gpgpu gpu compiler cuda opencl
最后活动时间: 2026-06-12

cuda-oxide

实验性Rust到CUDA编译器，支持用安全的Rust编写GPU内核并直接编译为PTX，无需DSL或外部语言绑定。

Stars: ⭐️ 2.7k
Tags: cuda gpu rust compiler high-performance-computing
最后活动时间: 2026-06-12

ik_llama.cpp

llama.cpp的高性能分支，提供SOTA量化方案和优化的推理性能，适合本地部署大语言模型。

Stars: ⭐️ 2.7k
Tags: llm inference quantization cpp
最后活动时间: 2026-06-12

xsimd

跨平台SIMD指令集封装库，支持SSE、AVX、NEON等指令集，为AI推理和数值计算提供硬件级加速优化。

Stars: ⭐️ 2.7k
Tags: simd vectorization hardware-acceleration cpp
最后活动时间: 2026-06-11

CV-CUDA

由ByteDance和NVIDIA联合开发的开源GPU加速计算机视觉库，专为云端大规模图像处理设计。

Stars: ⭐️ 2.7k
Tags: computer-vision cuda gpu image-processing
最后活动时间: 2026-05-28

ipyparallel

IPython并行计算框架，支持交互式并行数据处理与模型训练加速。

Stars: ⭐️ 2.6k
Tags: parallel-computing ipython distributed python
最后活动时间: 2026-05-26

aimet

高通开发的神经网络量化压缩库，提供先进的量化和剪枝技术。

Stars: ⭐️ 2.6k
Tags: 模型量化 模型压缩 深度学习
最后活动时间: 2026-05-09

DirectML

微软推出的高性能机器学习GPU加速库，基于DirectX 12，支持AMD、Intel、NVIDIA等全系列GPU硬件加速。

Stars: ⭐️ 2.6k
Tags: GPU加速 DirectX 机器学习
最后活动时间: 2026-04-27

kompute

基于Vulkan的通用GPU计算框架，支持跨厂商显卡，适用于深度学习和机器学习加速。

Stars: ⭐️ 2.5k
Tags: gpu-computing vulkan deep-learning
最后活动时间: 2026-05-27

TypeGPU

基于WebGPU的模块化工具包，支持TypeScript编写着色器，提供高级类型推断能力。

Stars: ⭐️ 2.5k
Tags: webgpu gpu-computing typescript gpgpu
最后活动时间: 2026-05-28

neural-engine

Apple Neural Engine (ANE) 技术文档，涵盖CoreML、iOS神经网络加速等硬件细节。

Stars: ⭐️ 2.5k
Tags: neural-engine coreml ios hardware-acceleration neural-network
最后活动时间: 2026-03-12

lucebox-hub

针对特定消费级硬件优化的LLM推理引擎，支持AMD、Apple Silicon和NVIDIA等多种硬件平台。

Stars: ⭐️ 2.4k
Tags: llm-inference hardware-optimization local-ai apple-silicon nvidia-cuda
最后活动时间: 2026-06-11

cccl

NVIDIA官方CUDA核心计算库，为AI框架提供GPU加速的基础计算能力，是深度学习底层优化的基石。

Stars: ⭐️ 2.4k
Tags: CUDA GPU NVIDIA
最后活动时间: 2026-06-12

coralnpu

面向边缘AI的能效优化机器学习加速器核心设计。

Stars: ⭐️ 2.4k
Tags: npu edge-ai hardware-accelerator machine-learning
最后活动时间: 2026-06-11

XNNPACK

高效的浮点神经网络推理算子库，针对移动端、服务器和Web平台优化，支持SIMD加速。

Stars: ⭐️ 2.4k
Tags: CPU推理 SIMD 移动端 性能优化
最后活动时间: 2026-05-29

mirage

将LLM编译为持久化内核的优化框架，通过MegaKernel技术提升大模型推理性能。

Stars: ⭐️ 2.3k
Tags: LLM Kernel Optimization
最后活动时间: 2026-06-12

Simd

C++高性能图像处理与机器学习库，利用SIMD指令集(SSE/AVX/NEON)实现硬件加速。

Stars: ⭐️ 2.3k
Tags: simd image-processing neural-network
最后活动时间: 2026-06-12

vllm-ascend

vLLM在华为昇腾NPU上的硬件适配插件，支持在Ascend硬件上高效运行大模型推理服务。

Stars: ⭐️ 2.2k
Tags: vLLM Ascend 硬件加速
最后活动时间: 2026-06-12

gpu-burn

多GPU CUDA压力测试工具，用于验证GPU硬件稳定性和性能，适合AI训练前的硬件检测。

Stars: ⭐️ 2.2k
Tags: cuda gpu stress-test benchmark
最后活动时间: 2026-05-27

cubecl

多平台高性能计算语言扩展，支持CUDA、WebGPU等后端，为Rust提供GPU加速计算能力。

Stars: ⭐️ 2.2k
Tags: GPU CUDA WebGPU Rust
最后活动时间: 2026-06-11

cugraph

NVIDIA RAPIDS图分析库，提供GPU加速的大规模图计算和图神经网络支持。

Stars: ⭐️ 2.2k
Tags: graph-analytics cuda gpu rapids graph-neural-network
最后活动时间: 2026-05-29

dstack

开源GPU控制平面，支持在多云和本地环境运行AI开发、训练和推理任务，简化LLM和深度学习工作负载编排。

Stars: ⭐️ 2.2k
Tags: GPU ML Infrastructure Training Inference
最后活动时间: 2026-06-12

cutile-python

NVIDIA cuTile Python编程模型，简化GPU并行内核开发，支持基于Tile的编程范式。

Stars: ⭐️ 2.1k
Tags: cuda gpu kernel python parallel-computing
最后活动时间: 2026-05-28

pycuda

undefined

Stars: ⭐️ 2.0k
Tags: cuda gpu gpu-computing python scientific-computing
最后活动时间: 2026-03-27

hls4ml

将机器学习模型部署到 FPGA 的开源库，利用高级综合技术实现神经网络硬件加速，适用于低延迟推理场景。

Stars: ⭐️ 2.0k
Tags: FPGA HLS 硬件加速 边缘部署
最后活动时间: 2026-06-10

intel-extension-for-pytorch

Intel官方PyTorch扩展，优化Intel平台上的深度学习性能。

Stars: ⭐️ 2.0k
Tags: pytorch intel optimization quantization
最后活动时间: 2026-03-30

chapel

高性能并行编程语言，专为科学计算、分布式计算和GPU加速设计，适合大规模AI和HPC工作负载。

Stars: ⭐️ 2.0k
Tags: parallel-computing gpu hpc programming-language
最后活动时间: 2026-05-28

awesome-webgpu

WebGPU生态系统精选资源列表，涵盖GPU计算、3D图形和浏览器端机器学习推理加速技术。

Stars: ⭐️ 1.9k
Tags: webgpu gpu-computing machine-learning browser-ai
最后活动时间: 2026-01-21

lupine

GPU over IP桥接工具，允许将远程机器上的GPU附加到仅CPU的机器上，实现GPU资源的远程访问与共享。

Stars: ⭐️ 1.9k
Tags: cuda gpu mlops remote-access
最后活动时间: 2026-05-28

scuda

GPU over IP 网络桥接工具，允许 CPU-only 机器远程挂载和使用远程 GPU 资源，支持 CUDA、cuDNN 等深度学习加速库。

Stars: ⭐️ 1.9k
Tags: GPU CUDA Networking MLOps
最后活动时间: 2026-05-20

AdaptiveCpp

跨平台异构计算编译器，支持SYCL、HIP/CUDA等多种编程模型，让AI应用无缝适配不同厂商的CPU和GPU硬件。

Stars: ⭐️ 1.9k
Tags: sycl gpu-computing heterogeneous-computing cuda compiler
最后活动时间: 2026-05-28

lapack

工业级线性代数计算库，是深度学习框架的核心依赖。

Stars: ⭐️ 1.8k
Tags: lapack blas linear-algebra matrix-factorization svd
最后活动时间: 2026-04-23

NumKong

高性能SIMD加速数值计算库，支持16种数值类型的距离计算、矩阵运算和向量搜索，跨平台支持x86、Arm、RISC-V和WASM。

Stars: ⭐️ 1.8k
Tags: SIMD 数值计算 向量搜索
最后活动时间: 2026-06-11

Vitis-AI

Xilinx官方AI推理开发栈，支持边缘设备和Alveo加速卡的AI模型部署。

Stars: ⭐️ 1.8k
Tags: ai-inference fpga edge-ai hardware-acceleration xilinx
最后活动时间: 2026-02-24

moderngpu

GPU计算模式与行为库，提供高效的并行算法实现，适用于深度学习底层优化。

Stars: ⭐️ 1.8k
Tags: gpu gpgpu cuda parallel-computing
最后活动时间: 2026-01-17

VkFFT

跨平台高性能FFT库，支持Vulkan、CUDA、HIP、OpenCL等多种GPU后端，适用于AI音频处理和信号处理场景。

Stars: ⭐️ 1.7k
Tags: fft cuda vulkan gpu-computing opencl
最后活动时间: 2026-04-04

dcgm-exporter

NVIDIA GPU监控指标导出器，集成DCGM为Prometheus提供GPU性能数据，适用于AI集群监控。

Stars: ⭐️ 1.7k
Tags: gpu prometheus monitoring nvidia kubernetes
最后活动时间: 2026-05-12

ILGPU

高性能 .NET GPU JIT 编译器，支持 CUDA、OpenCL 和 CPU 后端，为 AI 计算提供跨平台 GPU 加速能力。

Stars: ⭐️ 1.7k
Tags: gpu-computing jit-compiler cuda opencl dotnet
最后活动时间: 2026-05-29

BarraCUDA

开源CUDA编译器，支持将CUDA代码编译至AMD和Tenstorrent GPU架构。

Stars: ⭐️ 1.7k
Tags: CUDA compiler GPU cross-platform
最后活动时间: 2026-06-05

compute

基于OpenCL的C++ GPU计算库，为AI/ML工作负载提供高性能并行计算能力。

Stars: ⭐️ 1.7k
Tags: gpu-computing opencl gpgpu hpc parallel-computing
最后活动时间: 2026-04-22

picolm

在10美元的开发板上运行10亿参数大语言模型的轻量级推理方案，支持256MB RAM的嵌入式设备。

Stars: ⭐️ 1.6k
Tags: LLM Embedded Quantization Edge AI
最后活动时间: 2026-02-22

Enzyme

高性能自动微分编译器，支持LLVM和MLIR，为PyTorch、TensorFlow等深度学习框架提供梯度计算优化。

Stars: ⭐️ 1.6k
Tags: Automatic Differentiation Compiler Deep Learning LLVM
最后活动时间: 2026-06-12

tfhe-rs

纯Rust实现的TFHE全同态加密方案，支持在加密数据上进行布尔和整数运算。为隐私保护AI和机密机器学习提供核心密码学基础设施。

Stars: ⭐️ 1.6k
Tags: homomorphic-encryption cryptography privacy-preserving rust
最后活动时间: 2026-06-12

Anemll

专为Apple Neural Engine设计的机器学习库，支持在Apple Silicon上高效运行神经网络模型。

Stars: ⭐️ 1.6k
Tags: machine-learning neural-engine apple-silicon core-ml
最后活动时间: 2026-03-10

kernl

一行代码加速PyTorch Transformer模型GPU推理，基于Triton的高性能内核优化。

Stars: ⭐️ 1.6k
Tags: CUDA PyTorch Transformer GPU
最后活动时间: 2026-01-28

Vitis-Tutorials

Xilinx Vitis深度教程，涵盖FPGA、HLS和AI引擎的硬件加速开发技术。

Stars: ⭐️ 1.6k
Tags: fpga hls aiengine vitis hardware-acceleration
最后活动时间: 2026-05-22

FBGEMM

Facebook开源的高性能矩阵乘法库，专为深度学习推理优化，支持低精度计算和CPU加速。

Stars: ⭐️ 1.6k
Tags: deep-learning inference matrix-multiplication optimization
最后活动时间: 2026-05-28

gpu-hot

实时NVIDIA GPU监控仪表板，支持LLM训练和MLOps场景下的GPU资源可视化监控。

Stars: ⭐️ 1.5k
Tags: GPU Monitoring NVIDIA MLOps
最后活动时间: 2026-05-28

mllm

面向移动设备的高效多模态大语言模型推理框架，优化端侧性能。

Stars: ⭐️ 1.5k
Tags: Multimodal Mobile Inference
最后活动时间: 2026-06-09

brevitas

PyTorch神经网络量化库，支持PTQ和QAT量化方法，优化模型在FPGA等硬件上的部署性能。

Stars: ⭐️ 1.5k
Tags: quantization pytorch fpga
最后活动时间: 2026-06-11

tt-metal

Tenstorrent AI加速器底层编程框架，支持LLaMA、DeepSeek、Stable Diffusion等主流模型的硬件加速优化。

Stars: ⭐️ 1.5k
Tags: AI加速器 硬件优化 LLM
最后活动时间: 2026-06-12

nvidia_gpu_exporter

基于nvidia-smi的Prometheus GPU监控导出器，可实时监控GPU使用率、显存、温度等关键指标，适合AI训练和推理场景的资源监控。

Stars: ⭐️ 1.5k
Tags: GPU监控 Prometheus NVIDIA
最后活动时间: 2026-06-08

FastFlowLM

专为AMD Ryzen AI NPU优化的本地LLM运行工具，类似Ollama但深度适配AMD硬件，充分发挥NPU加速能力。

Stars: ⭐️ 1.5k
Tags: AMD NPU 本地部署
最后活动时间: 2026-06-11

lightning-thunder

PyTorch编译器，加速训练和推理过程。提供内置的性能、内存和并行优化，支持自定义优化扩展。

Stars: ⭐️ 1.5k
Tags: pytorch compiler optimization deep-learning
最后活动时间: 2026-05-25

TornadoVM

一个高效的异构编程框架，支持Java等托管语言在GPU上运行，实现透明的并行计算加速。

Stars: ⭐️ 1.5k
Tags: GPU CUDA Parallel Computing
最后活动时间: 2026-05-28

auto-round

Intel开源的高精度LLM量化工具包，支持MXFP4、NVFP4、GGUF等多种格式，以精度优先设计最大限度减少量化损失。

Stars: ⭐️ 1.4k
Tags: 量化 LLM Intel
最后活动时间: 2026-06-12

deepops

用于构建GPU集群的工具集，支持深度学习和HPC工作负载的部署与管理。

Stars: ⭐️ 1.4k
Tags: gpu cluster deep-learning hpc infrastructure
最后活动时间: 2026-05-28

MatX

现代C++20 GPU数值计算库，提供Python风格的简洁语法，专为高性能计算优化。

Stars: ⭐️ 1.4k
Tags: GPU Computing C++ HPC
最后活动时间: 2026-05-28

uccl

高效的GPU通信库，支持集合通信、P2P传输（KV缓存、RL权重）和端点通信，专为AI/LLM工作负载优化。

Stars: ⭐️ 1.4k
Tags: GPU RDMA LLM HPC
最后活动时间: 2026-06-12

CUDA.jl

Julia语言的CUDA编程接口，提供完整的GPU计算支持和高性能并行编程能力。

Stars: ⭐️ 1.4k
Tags: CUDA Julia GPU
最后活动时间: 2026-06-12

autokernel

自动化GPU内核优化工具，输入PyTorch模型自动生成优化的Triton内核。

Stars: ⭐️ 1.4k
Tags: cuda triton gpu pytorch optimization
最后活动时间: 2026-03-19

compute-runtime

Intel显卡计算运行时，支持oneAPI Level Zero和OpenCL驱动，为AI计算提供底层GPU加速支持。

Stars: ⭐️ 1.4k
Tags: opencl gpu intel compute
最后活动时间: 2026-05-28

NVIDIA-patcher

为NVIDIA矿卡和特定GPU型号启用3D加速和完整计算功能的驱动补丁工具，可用于AI/ML工作负载的硬件加速。

Stars: ⭐️ 1.4k
Tags: nvidia gpu hardware-acceleration driver-patch
最后活动时间: 2026-05-28

scikit-learn-intelex

Intel推出的Scikit-learn加速扩展，通过oneAPI无缝提升机器学习算法性能，支持CPU/GPU加速。

Stars: ⭐️ 1.4k
Tags: Scikit-learn GPU Acceleration Intel Performance
最后活动时间: 2026-06-12

eve

高性能C++ SIMD向量计算库，为机器学习和科学计算提供硬件加速支持。

Stars: ⭐️ 1.3k
Tags: simd cpp hpc vectorization performance
最后活动时间: 2026-05-28

openlake

专为GPU工作负载设计的高效存储解决方案，为LLM训练和模型服务提供极速数据吞吐能力。

Stars: ⭐️ 1.3k
Tags: gpu llm-training model-serving storage rdma
最后活动时间: 2026-06-11

Oceananigans.jl

基于Julia的高性能流体动力学模拟框架，支持CPU和GPU加速计算，集成机器学习功能用于气候和海洋科学研究。

Stars: ⭐️ 1.3k
Tags: fluid-dynamics gpu julia machine-learning scientific-computing
最后活动时间: 2026-05-28

club-3090

RTX 3090 显卡运行大语言模型的社区配置方案，支持 vLLM、llama.cpp、SGLang 等多引擎。

Stars: ⭐️ 1.3k
Tags: llm vllm llama-cpp rtx3090 model-serving
最后活动时间: 2026-06-12

armnn

Arm官方机器学习软件栈，为Arm处理器提供高效的神经网络推理加速。

Stars: ⭐️ 1.3k
Tags: arm machine-learning neural-network embedded
最后活动时间: 2026-01-23

stdgpu

高效的GPU端STL风格数据结构库，支持CUDA和HIP，为GPU计算提供类STL的便捷接口。

Stars: ⭐️ 1.3k
Tags: cuda gpu data-structures cpp hip
最后活动时间: 2026-06-08

awesome-high-performance-computing

高性能计算资源精选列表，涵盖HPC核心技术与资源，对大规模AI模型训练至关重要。

Stars: ⭐️ 1.3k
Tags: hpc high-performance-computing supercomputing parallel-computing
最后活动时间: 2026-05-11

DLSS-Enabler

在任意DirectX 12兼容GPU上模拟DLSS超分辨率和帧生成功能，让非NVIDIA显卡也能体验AI加速的游戏画质提升。

Stars: ⭐️ 1.2k
Tags: dlss ai-upscaling directx12 gpu frame-generation
最后活动时间: 2026-05-17

gputil

Python模块，用于通过nvidia-smi以编程方式获取NVIDIA GPU的状态信息，适合AI训练监控。

Stars: ⭐️ 1.2k
Tags: gpu nvidia monitoring python
最后活动时间: 2026-04-02

detect-gpu

基于3D渲染基准分数对GPU进行分类，帮助开发者为图形密集型AI应用提供合理的默认设置。

Stars: ⭐️ 1.2k
Tags: gpu-detection webgl hardware-detection benchmark
最后活动时间: 2026-06-07

react-native-fast-tflite

高性能React Native TensorFlow Lite库，支持GPU加速，为移动端AI推理提供高效解决方案。

Stars: ⭐️ 1.2k
Tags: TensorFlow Lite React Native Mobile AI
最后活动时间: 2026-04-27

languagemodels

在512MB内存中运行大语言模型，适合边缘设备和低资源环境。

Stars: ⭐️ 1.2k
Tags: llm edge-computing optimization
最后活动时间: 2026-02-19

CLBlast

优化的OpenCL BLAS库，提供GPU加速的矩阵运算，是AI计算的基础设施组件。

Stars: ⭐️ 1.2k
Tags: blas opencl gpu linear-algebra
最后活动时间: 2026-04-13

keops

高效的内核运算库，支持CPU和GPU上的自动微分，无内存溢出问题，适用于大规模机器学习计算。

Stars: ⭐️ 1.2k
Tags: gpu autodiff kernel-operations machine-learning pytorch
最后活动时间: 2026-05-27

cudarc

Rust语言的CUDA安全封装库，提供CUDA、cuDNN、cuBLAS等工具的Rust绑定，便于GPU加速开发。

Stars: ⭐️ 1.2k
Tags: cuda rust gpu cudnn cublas
最后活动时间: 2026-05-15

NVTabular

NVIDIA开源的表格数据特征工程库，专为TB级推荐系统数据集设计，支持GPU加速预处理。

Stars: ⭐️ 1.1k
Tags: deep-learning feature-engineering gpu recommendation-system nvidia
最后活动时间: 2026-05-22

pyopencl

Python的OpenCL集成库，提供GPU并行计算能力，支持多维数组和科学计算。

Stars: ⭐️ 1.1k
Tags: opencl gpu python parallel-computing
最后活动时间: 2026-04-19

neanderthal

高性能Clojure矩阵运算库，支持CPU和GPU加速，适用于机器学习和科学计算场景。

Stars: ⭐️ 1.1k
Tags: clojure matrix gpu cuda opencl
最后活动时间: 2026-05-18

gunrock

高性能CUDA/C++ GPU图分析库，支持大规模图计算的并行加速。

Stars: ⭐️ 1.1k
Tags: gpu cuda graph-analytics gnn high-performance
最后活动时间: 2026-02-28

InferenceX

开源连续推理基准测试工具，支持Qwen3.5、DeepSeek、GPT等主流模型在GB200、H100、MI355X等多种硬件平台上的性能对比评测。

Stars: ⭐️ 1.1k
Tags: Benchmark Inference GPU
最后活动时间: 2026-06-12

thrml

基于JAX构建的热力学超图模型库，支持概率计算与概率图模型的高效实现。

Stars: ⭐️ 1.1k
Tags: jax machine-learning probabilistic-computing
最后活动时间: 2026-05-26

cuda-quantum

NVIDIA量子计算编程框架，支持异构量子-经典混合工作流和量子机器学习。

Stars: ⭐️ 1.1k
Tags: quantum-computing cuda quantum-ml nvidia
最后活动时间: 2026-06-12

HugeCTR

NVIDIA开源的高效GPU框架，专为点击率(CTR)预估训练设计，支持大规模推荐系统。

Stars: ⭐️ 1.1k
Tags: deep-learning gpu-acceleration recommendation-system ctr
最后活动时间: 2026-03-12

agi

Android官方GPU性能分析工具，支持AI应用性能调优与调试。

Stars: ⭐️ 1.1k
Tags: android gpu profiler performance
最后活动时间: 2026-04-13

kvcached

虚拟化弹性KV缓存系统，支持动态GPU共享与多租户LLM推理，显著提升GPU资源利用率。

Stars: ⭐️ 1.1k
Tags: KV Cache GPU Sharing LLM Inference
最后活动时间: 2026-05-27

mlx-engine

LM Studio的Apple MLX推理引擎，专为Apple Silicon优化的本地模型运行方案。

Stars: ⭐️ 1.1k
Tags: mlx apple-silicon local-inference
最后活动时间: 2026-05-28

TheRock

轻量级开源构建系统，专为HIP和ROCm设计，支持AMD GPU的AI计算环境搭建。

Stars: ⭐️ 1.0k
Tags: rocm hip gpu amd build-system
最后活动时间: 2026-05-29

jaxopt

基于JAX的硬件加速、可批处理和可微分优化器库，支持多种优化算法的高效实现。

Stars: ⭐️ 1.0k
Tags: jax optimization deep-learning differentiable-programming
最后活动时间: 2025-12-17

onnx-mlir

基于MLIR编译器基础设施的ONNX模型表示与底层优化工具，支持将ONNX模型编译为高效机器码。

Stars: ⭐️ 1.0k
Tags: onnx mlir compiler machine-learning inference
最后活动时间: 2026-06-11

veScale

字节跳动开源的PyTorch分布式训练框架，专为LLM与RL大规模训练设计。

Stars: ⭐️ 1.0k
Tags: pytorch distributed llm-training scalable
最后活动时间: 2026-03-03

raft

NVIDIA提供的CUDA加速机器学习基础算法库，涵盖向量搜索、聚类、线性代数等核心原语，是高性能AI应用的基础构建块。

Stars: ⭐️ 1.0k
Tags: CUDA 向量搜索 GPU加速
最后活动时间: 2026-06-11

LuisaCompute

高性能跨平台渲染框架，支持CUDA、DirectX、Metal等多种后端，可用于AI图形计算加速。

Stars: ⭐️ 1.0k
Tags: cuda gpu rendering raytracing cross-platform
最后活动时间: 2026-05-29

accelerate

Haskell高性能数组计算嵌入式语言，支持GPU加速和并行计算。

Stars: ⭐️ 1.0k
Tags: haskell gpu cuda parallel-computing
最后活动时间: 2026-04-02

MindPipe

一个强大的大语言模型和多模态大模型压缩框架，支持NVIDIA GPU和华为昇腾NPU，提供量化、剪枝等自动压缩能力，助力高效部署。

Stars: ⭐️ 1.0k
Tags: model-compression quantization pruning llm-deployment hardware-acceleration
最后活动时间: 2026-06-11

finn

用于FPGA上量化神经网络推理的数据流编译器，支持高效的硬件加速部署。

Stars: ⭐️ 1.0k
Tags: compiler fpga neural-network quantization
最后活动时间: 2026-06-11

rotorquant

KV缓存压缩方案，通过块对角旋转实现。比TurboQuant更优的PPL表现，解码速度提升28%，预填充速度提升5.3倍，参数量减少44倍，支持llama.cpp直接集成。

Stars: ⭐️ 1.0k
Tags: quantization kv-cache llm compression
最后活动时间: 2026-04-23

SpargeAttn

ICML2025论文实现，无需训练的稀疏注意力机制，可加速任意模型推理，支持LLM、视频生成和视觉Transformer。

Stars: ⭐️ 996
Tags: Sparse Attention Inference Optimization ICML2025
最后活动时间: 2026-02-25

Tutel

优化的混合专家(MoE)库，支持GptOss/DeepSeek/Kimi-K2/Qwen3，兼容FP8/NVFP4/MXFP4量化。

Stars: ⭐️ 993
Tags: MoE Optimization Inference
最后活动时间: 2026-06-04

opt_einsum

优化NumPy、TensorFlow等框架中的einsum张量收缩运算，通过优化收缩顺序显著提升计算性能。

Stars: ⭐️ 982
Tags: Tensor Optimization Performance Deep Learning
最后活动时间: 2026-03-19

spark-rapids

NVIDIA开发的Spark插件，利用GPU加速Apache Spark数据处理，显著提升大规模数据处理和机器学习工作负载的性能。

Stars: ⭐️ 976
Tags: GPU Spark Acceleration Big Data
最后活动时间: 2026-05-28

cupynumeric

支持多节点多GPU系统的NumPy和SciPy加速库，为大规模科学计算和机器学习提供高性能数值计算能力。

Stars: ⭐️ 975
Tags: gpu numpy scipy hpc numerical-computing
最后活动时间: 2026-05-27

cuda-tile

基于MLIR的CUDA内核优化编译器基础设施，专注于张量核心单元的Tile计算模式优化，提升AI推理性能。

Stars: ⭐️ 964
Tags: mlir cuda compiler tensor-core gpu-optimization
最后活动时间: 2026-05-28

CUDA-Agent

基于大规模智能体强化学习的高性能CUDA内核生成框架，自动化GPU算子优化。

Stars: ⭐️ 961
Tags: cuda reinforcement-learning kernel-generation code-generation optimization
最后活动时间: 2026-03-04

libxsmm

专注于密集和稀疏矩阵运算的优化库，为深度学习提供高性能计算原语。

Stars: ⭐️ 956
Tags: blas simd matrix-multiplication deep-learning intel
最后活动时间: 2026-05-28

kineto

PyTorch官方使用的CPU/GPU性能分析库，提供时间线追踪和硬件性能计数器访问，帮助优化AI模型训练性能。

Stars: ⭐️ 956
Tags: profiling gpu pytorch performance tracing
最后活动时间: 2026-05-20

hqq

半二次量化官方实现，高效压缩大模型同时保持性能。

Stars: ⭐️ 940
Tags: quantization llm optimization
最后活动时间: 2026-02-26

tpu-mlir

基于MLIR的机器学习编译器，专为Sophgo TPU加速器优化，支持LLM模型部署。

Stars: ⭐️ 933
Tags: compiler mlir tpu llm
最后活动时间: 2026-06-08

mpi4py

MPI的Python绑定库，为分布式AI训练和大规模并行计算提供基础设施支持，是深度学习集群训练的核心依赖。

Stars: ⭐️ 912
Tags: mpi parallel-computing distributed hpc
最后活动时间: 2026-05-23

exllamav3

专为消费级GPU优化的LLM量化和推理库，支持在本地高效运行大语言模型。

Stars: ⭐️ 905
Tags: LLM Quantization Inference GPU
最后活动时间: 2026-05-28

cuopt

NVIDIA GPU加速决策优化求解器，支持线性规划等优化问题的高性能计算。

Stars: ⭐️ 903
Tags: cuda optimization gpu linear-programming operations-research
最后活动时间: 2026-05-29

ComfyUI-MultiGPU

ComfyUI自定义节点，提供一键虚拟显存和多GPU集成支持，支持UNet和CLIP加载器的层卸载与Block Swap，最大化显卡潜空间利用。

Stars: ⭐️ 897
Tags: ComfyUI Multi-GPU Stable Diffusion VRAM优化
最后活动时间: 2026-05-08

framework

一个用Rust后端和TypeScript API构建的机器学习库，支持CUDA和WebGPU，适合深入理解ML框架内部原理。

Stars: ⭐️ 894
Tags: machine-learning rust cuda webgpu ml-framework
最后活动时间: 2026-04-20

cuda-api-wrappers

轻量级、统一的C++风格CUDA API封装库，简化GPU编程开发。

Stars: ⭐️ 890
Tags: cuda gpu gpgpu cpp
最后活动时间: 2026-05-26

nncase

开源深度学习编译器栈，专为Kendryte AI加速器设计，支持神经网络模型优化部署。

Stars: ⭐️ 885
Tags: ai-compiler deep-learning neural-network llm
最后活动时间: 2026-03-26

causal-conv1d

高性能CUDA因果深度可分离一维卷积实现，提供PyTorch接口，适用于Mamba等状态空间模型。

Stars: ⭐️ 885
Tags: cuda pytorch convolution mamba state-space-model
最后活动时间: 2026-05-09

dgx-spark-playbooks

NVIDIA DGX Spark设备AI/ML工作负载部署指南集合，专为Blackwell架构优化。提供详细的步骤化配置手册。

Stars: ⭐️ 883
Tags: nvidia dgx blackwell ai-infrastructure gpu
最后活动时间: 2026-05-26

TinyNeuralNetwork

高效的深度学习模型压缩框架，支持剪枝、量化等模型优化技术。

Stars: ⭐️ 879
Tags: model-compression quantization pruning pytorch deep-learning
最后活动时间: 2026-03-03

nvbench

NVIDIA CUDA内核基准测试库，帮助开发者精确测量和分析GPU内核性能。

Stars: ⭐️ 873
Tags: cuda benchmark gpu nvidia performance
最后活动时间: 2026-06-04

helion

一个Python嵌入式DSL，用于编写快速、可扩展的ML内核，减少样板代码。

Stars: ⭐️ 871
Tags: ml-kernels dsl gpu-computing machine-learning
最后活动时间: 2026-05-28

amgcl

C++代数多重网格库，用于求解大规模稀疏线性系统，支持CUDA和OpenCL加速。

Stars: ⭐️ 865
Tags: cuda linear-solvers scientific-computing opencl
最后活动时间: 2026-06-10

cudnn-frontend

cuDNN的C++封装库，为深度学习提供GPU加速的底层API接口，简化神经网络计算开发。

Stars: ⭐️ 844
Tags: cudnn deep-learning gpu nvidia neural-network
最后活动时间: 2026-06-11

ROCmLibs-for-gfx1103-AMD780M-APU

为AMD APU提供ROCm库支持，使AMD GPU能够运行AI/ML工作负载。

Stars: ⭐️ 834
Tags: rocm amd gpu machine-learning
最后活动时间: 2026-05-18

sleef

SIMD数学函数库，提供向量化的基础函数和DFT实现，支持多种CPU架构。

Stars: ⭐️ 830
Tags: simd math-library fft vectorization cuda
最后活动时间: 2025-12-25

RyzenAI-SW

AMD Ryzen AI 软件套件，提供在 AMD Ryzen AI PC 上优化和部署 AI 推理的工具与运行时库。

Stars: ⭐️ 826
Tags: amd ryzen-ai inference hardware-acceleration
最后活动时间: 2026-04-17

TheArtofHPC_pdfs

高性能计算系列书籍与课程资源，涵盖并行计算、科学计算等AI基础设施核心知识。

Stars: ⭐️ 812
Tags: hpc parallel-computing scientific-computing course
最后活动时间: 2026-01-29

jax-js

JAX的JavaScript实现，支持WebGPU和Wasm，让机器学习模型可直接在浏览器中高效运行。

Stars: ⭐️ 811
Tags: JAX Machine Learning WebGPU JavaScript
最后活动时间: 2026-05-27

GPUMD

基于GPU加速的分子动力学模拟工具，支持机器学习势能函数和神经网络势能，适用于材料科学和物理模拟领域。

Stars: ⭐️ 785
Tags: cuda molecular-dynamics machine-learning gpu neural-network
最后活动时间: 2026-06-11

ocl

Rust 语言的 OpenCL 绑定库，为 AI 和科学计算提供 GPU 加速能力。

Stars: ⭐️ 783
Tags: opencl rust gpgpu gpu-computing
最后活动时间: 2026-02-23

gpu-jupyter

GPU加速的JupyterLab环境，预装TensorFlow和PyTorch，支持可复现的深度学习实验。

Stars: ⭐️ 771
Tags: gpu-computing jupyter pytorch tensorflow deep-learning
最后活动时间: 2026-01-09

oneMath

Intel oneAPI数学库，提供跨CPU/GPU的高性能BLAS、RNG等数学运算支持。

Stars: ⭐️ 765
Tags: oneapi blas gpu math-library
最后活动时间: 2026-06-11

NATTEN

快速多维稀疏注意力机制实现，为Transformer模型提供高效的局部注意力计算。

Stars: ⭐️ 761
Tags: cuda attention pytorch transformer sparse-attention
最后活动时间: 2026-06-11

triattention

基于三角函数的KV缓存压缩技术，实现高效长推理，支持在显存受限的GPU上本地部署大语言模型。

Stars: ⭐️ 761
Tags: kv-cache llm-inference memory-optimization gpu
最后活动时间: 2026-04-23

DCGM

NVIDIA数据中心GPU管理工具，用于收集GPU遥测数据和监控GPU健康状态，是AI基础设施运维的重要组件。

Stars: ⭐️ 735
Tags: nvidia gpu telemetry data-center monitoring
最后活动时间: 2026-04-21

ai-reference-models

Intel AI参考模型，针对Intel处理器和GPU优化的深度学习工作负载。

Stars: ⭐️ 733
Tags: ai cpu deep-learning inference tensorflow
最后活动时间: 2026-02-11

YOLOv8-TensorRT-CPP

YOLOv8的TensorRT C++高性能部署实现，优化GPU推理加速。

Stars: ⭐️ 730
Tags: yolo tensorrt computer-vision inference
最后活动时间: 2026-05-30

Stim

高性能量子稳定器电路模拟库，支持量子错误校正和量子算法开发，适用于量子计算研究与AI硬件加速探索。

Stars: ⭐️ 730
Tags: quantum-computing quantum-algorithms quantum-simulation cirq
最后活动时间: 2026-05-22

optiland

基于PyTorch的光学设计与仿真库，支持GPU加速和可微分光线追踪，适用于光学系统优化和科学计算。

Stars: ⭐️ 730
Tags: pytorch ray-tracing optics differentiable gpu
最后活动时间: 2026-06-11

parca-agent

基于eBPF的持续性能分析工具，支持CPU和GPU性能监控，适用于Kubernetes环境下的AI工作负载优化。

Stars: ⭐️ 729
Tags: profiling gpu kubernetes observability cuda
最后活动时间: 2026-06-11

lava

Intel开源的神经形态计算软件框架，支持类脑计算和脉冲神经网络开发，适用于Loihi等神经形态硬件。

Stars: ⭐️ 727
Tags: neuromorphic-computing neural-networks deep-learning spiking-neural-networks
最后活动时间: 2026-05-13

how-to-optimize-gemm

矩阵乘法优化教程，涵盖CPU和GPU上的GEMM高性能实现技术。

Stars: ⭐️ 727
Tags: cuda gemm optimization gpu matrix-multiplication
最后活动时间: 2026-05-14

buddy-mlir

基于MLIR的编译器框架，连接领域特定语言(DSL)与领域特定架构(DSA)，加速AI模型部署。

Stars: ⭐️ 721
Tags: mlir compiler dsl hardware-acceleration deep-learning
最后活动时间: 2026-05-27

dflash-mlx

专为Apple Silicon优化的无损DFlash推测解码框架，基于MLX实现高效推理加速。

Stars: ⭐️ 709
Tags: mlx speculative-decoding apple-silicon inference-optimization
最后活动时间: 2026-05-17

TALOS-V2

Transformer模型的硬件实现，可在FPGA上运行microGPT，吞吐量达50k+ tokens/秒。

Stars: ⭐️ 703
Tags: hardware transformer fpga microgpt acceleration
最后活动时间: 2026-05-14

rmm

RAPIDS内存管理器，为CUDA应用提供高效的GPU内存分配和管理。

Stars: ⭐️ 698
Tags: cuda memory-management rapids gpu nvidia
最后活动时间: 2026-05-29

HIPIFY

将CUDA代码转换为可移植C++代码的工具，支持HIP框架，帮助开发者实现GPU代码跨平台迁移。

Stars: ⭐️ 698
Tags: cuda hip gpu portability code-conversion
最后活动时间: 2026-05-28

magnetron

零依赖的C语言机器学习框架，提供现代Python API，支持CUDA加速，专注于执行和内存控制。

Stars: ⭐️ 687
Tags: machine-learning neural-network cuda ml-framework
最后活动时间: 2026-06-11

AI-windows-whl

为Windows平台预编译的AI加速库whl包，包含Flash-attention、SageAttention、NATTEN、xFormer等核心组件，简化AI开发环境配置。

Stars: ⭐️ 678
Tags: ai flash-attention windows precompiled gpu-acceleration
最后活动时间: 2026-06-10

qsim

高性能量子电路状态向量模拟器，支持C++和Python，用于量子计算研究与量子算法开发。

Stars: ⭐️ 671
Tags: quantum-computing quantum-simulator quantum-algorithms cpp python
最后活动时间: 2026-06-07

wgpu-py

Python的WebGPU接口实现，支持跨平台GPU计算与图形渲染。

Stars: ⭐️ 669
Tags: webgpu python gpu vulkan metal
最后活动时间: 2026-04-22

qiskit-aer

IBM量子计算高性能电路模拟器，支持噪声模型和GPU加速，是量子机器学习研究的重要基础设施。

Stars: ⭐️ 667
Tags: quantum-computing qiskit simulator gpu
最后活动时间: 2026-05-25

EDA-Q

量子芯片设计全栈EDA工具，支持超导和离子阱量子计算架构，帮助研究人员高效设计、模拟和优化量子芯片。

Stars: ⭐️ 667
Tags: quantum-computing eda chip-design quantum
最后活动时间: 2026-05-13

qpp

现代C++量子计算库，提供量子态模拟和量子算法实现，支持量子门操作和量子电路构建。

Stars: ⭐️ 661
Tags: quantum-computing cpp simulator quantum
最后活动时间: 2026-06-11

optiland

基于PyTorch的GPU加速光学设计工具，支持可微分光线追踪，适用于光学系统优化与仿真。

Stars: ⭐️ 656
Tags: optics pytorch differentiable ray-tracing gpu simulation
最后活动时间: 2026-04-19

sonic-moe

针对混合专家模型(MoE)的IO和分块感知优化加速方案，提升大规模模型推理效率。

Stars: ⭐️ 654
Tags: moe optimization acceleration inference
最后活动时间: 2026-04-22

ompi

高性能分布式消息传递接口库，广泛用于大规模并行计算和AI模型分布式训练场景。

Stars: ⭐️ 650
Tags: mpi hpc distributed-computing parallel-computing
最后活动时间: 2026-05-27

oneDAL

Intel oneAPI数据分析库，提供高性能机器学习算法和数据分析功能，支持AI训练与推理加速。

Stars: ⭐️ 649
Tags: machine-learning data-analytics oneapi cpp
最后活动时间: 2026-06-11

cuCollections

NVIDIA开源的CUDA数据结构库，提供GPU加速的高性能哈希表、哈希集合等并发数据结构。

Stars: ⭐️ 648
Tags: cuda gpu datastructures hashmap nvidia
最后活动时间: 2026-06-10

mlir-aie

基于MLIR的AMD AI Engine工具链，为NPU加速器提供编译器支持和开发框架。

Stars: ⭐️ 645
Tags: mlir npu llvm compiler hardware-acceleration
最后活动时间: 2026-05-27

nCPU

面向模型原生和张量优化的CPU研究运行时，提供组织化的工作负载、工具和文档，适合AI推理优化研究。

Stars: ⭐️ 641
Tags: cpu-optimization tensor ml-runtime inference
最后活动时间: 2026-06-12

k8s-dra-driver-gpu

NVIDIA Kubernetes DRA驱动，为Kubernetes集群提供GPU资源调度和管理能力。

Stars: ⭐️ 631
Tags: kubernetes nvidia gpu dra infrastructure
最后活动时间: 2026-04-22

nvidia-dra-driver-gpu

NVIDIA DRA GPU驱动程序，为Kubernetes等容器编排平台提供GPU资源分配和管理能力。

Stars: ⭐️ 631
Tags: nvidia gpu kubernetes driver dra
最后活动时间: 2026-04-22

loopy

面向CPU和GPU的数组计算代码生成器，支持自动优化和并行化。

Stars: ⭐️ 630
Tags: cuda code-generation gpu-computing opencl
最后活动时间: 2026-05-28

wincnn

Winograd最小化卷积算法生成器，用于优化卷积神经网络的计算效率。

Stars: ⭐️ 627
Tags: cnn winograd optimization deep-learning
最后活动时间: 2026-02-09

vibetensor

AI辅助生成的深度学习系统，基于CUDA和CUTASS构建高性能计算框架。

Stars: ⭐️ 624
Tags: cuda cutlass deep-learning pytorch
最后活动时间: 2026-02-02

aws-neuron-sdk

AWS专用机器学习芯片SDK，支持PyTorch和TensorFlow原生集成，提供高性能低成本推理。

Stars: ⭐️ 606
Tags: aws machine-learning hardware-acceleration
最后活动时间: 2026-05-22

attorch

基于OpenAI Triton实现的PyTorch神经网络模块子集，提供高效的GPU加速计算。

Stars: ⭐️ 602
Tags: triton pytorch cuda deep-learning
最后活动时间: 2026-05-13

ginkgo

高性能数值线性代数库，支持多后端（CUDA、HIP、OpenMP），为AI和科学计算提供核心矩阵运算加速。

Stars: ⭐️ 596
Tags: linear-algebra gpu-computing cuda hip sparse-matrix hpc
最后活动时间: 2026-05-28

optimum-intel

HuggingFace Optimum Intel版，提供Intel硬件加速的模型推理优化工具。

Stars: ⭐️ 589
Tags: optimization intel openvino quantization inference
最后活动时间: 2026-05-28

dace

以数据为中心的并行编程框架，支持CUDA、FPGA等多种硬件加速后端。

Stars: ⭐️ 583
Tags: cuda fpga hpc parallel-computing
最后活动时间: 2026-05-28

qkeras

TensorFlow Keras量化深度学习库，面向FPGA和ASIC硬件加速的模型量化工具。

Stars: ⭐️ 582
Tags: quantization keras fpga hardware-acceleration deep-learning
最后活动时间: 2026-02-23

AutoDock-GPU

GPU加速的分子对接软件，用于药物发现和计算生物学研究，支持CUDA和OpenCL加速。

Stars: ⭐️ 581
Tags: molecular-docking gpu-computing cuda drug-discovery computational-biology
最后活动时间: 2026-03-10

nvmath-python

NVIDIA为Python生态系统提供的数学库，支持GPU加速计算，适用于AI/ML高性能计算场景。

Stars: ⭐️ 569
Tags: nvidia gpu math acceleration
最后活动时间: 2026-05-01

astra-sim

用于大规模AI模型训练的层次化网络与 disaggregated 系统建模仿真器，帮助优化分布式训练架构设计。

Stars: ⭐️ 568
Tags: distributed-training simulation large-language-models network-modeling
最后活动时间: 2026-03-25

ComfyUI-Distributed

ComfyUI扩展插件，支持本地、远程和云端的多GPU分布式处理。

Stars: ⭐️ 554
Tags: comfyui multi-gpu distributed-computing stable-diffusion
最后活动时间: 2026-05-27

jetson-image

为Nvidia Jetson系列AI开发板创建最小化Ubuntu系统镜像的工具，支持边缘AI部署。

Stars: ⭐️ 550
Tags: nvidia-jetson edge-ai embedded-systems ubuntu
最后活动时间: 2026-03-09

rkllama

专为Rockchip NPU优化的Ollama替代方案，支持在Orange Pi等开发板上高效运行LLM和深度学习模型。

Stars: ⭐️ 543
Tags: llm npu rockchip edge-ai llm-inference
最后活动时间: 2026-05-18

nvshmem

NVIDIA开发的并行编程接口，支持GPU间高效通信，可显著降低多进程通信开销，适用于深度学习分布式训练场景。

Stars: ⭐️ 537
Tags: cuda gpu parallel-computing deep-learning nvidia
最后活动时间: 2026-05-05

pytorch

华为昇腾PyTorch适配器(torch_npu)，为PyTorch提供昇腾NPU硬件加速支持。

Stars: ⭐️ 535
Tags: pytorch ascend deep-learning hardware-acceleration
最后活动时间: 2026-06-12

jetson-nano-baseboard

NVIDIA Jetson系列开发板的开源硬件底板设计，支持Jetson Nano、TX2 NX和Xavier NX，适用于边缘AI计算场景。

Stars: ⭐️ 528
Tags: nvidia jetson edge-ai hardware
最后活动时间: 2025-12-31

mpi4jax

JAX数组零拷贝MPI通信库，为高性能计算应用提供分布式加速支持。

Stars: ⭐️ 525
Tags: jax mpi hpc distributed-computing
最后活动时间: 2026-05-20

mscclpp

MSCCL++是一个GPU驱动的通信栈，专为可扩展AI应用设计，优化分布式训练和推理的GPU间通信性能。

Stars: ⭐️ 525
Tags: gpu communication distributed-systems cuda ai-infrastructure
最后活动时间: 2026-05-29

ROCm-docker

AMD ROCm 软件平台的 Docker 镜像集合，为 AI/ML 工作负载提供 GPU 加速环境支持。

Stars: ⭐️ 519
Tags: docker rocm gpu amd deep-learning
最后活动时间: 2026-01-27

cuLA

基于CuTe DSL和CUTLASS C++编写的线性注意力变体CUDA内核，为Transformer模型提供高效GPU加速。

Stars: ⭐️ 512
Tags: cuda linear-attention transformers gpu-kernels
最后活动时间: 2026-05-29

slurm-docker-cluster

基于Docker的Slurm集群部署方案，支持CUDA和NVIDIA GPU，适用于HPC和AI训练工作负载。

Stars: ⭐️ 511
Tags: slurm docker cuda gpu hpc
最后活动时间: 2026-05-08

torchft

PyTorch分布式训练容错库，支持HSDP、LocalSGD、DiLoCo等多种分布式训练策略，确保大规模模型训练的稳定性和可靠性。

Stars: ⭐️ 511
Tags: pytorch distributed-training fault-tolerance diloco
最后活动时间: 2026-06-09

Vitis-AI-Tutorials

AMD Xilinx Vitis AI框架官方教程，指导如何在FPGA平台上部署和加速深度学习推理。

Stars: ⭐️ 510
Tags: vitis-ai fpga edge-ai model-deployment
最后活动时间: 2026-01-16

docker-ubuntu-desktop

支持GPU硬件加速的Ubuntu桌面Docker镜像，可通过SSH或远程桌面访问容器环境，适用于AI开发和CUDA计算场景。

Stars: ⭐️ 505
Tags: cuda docker gpu remote-desktop nvidia
最后活动时间: 2026-05-28

CUDA-L2

利用强化学习优化CUDA矩阵乘法内核，性能超越NVIDIA cuBLAS库。为大规模语言模型和深度学习提供更高效的GPU计算加速方案。

Stars: ⭐️ 438
Tags: cuda gpu-optimization matrix-multiplication reinforcement-learning hardware-acceleration
最后活动时间: 2026-03-30

Model Serving

tensorflow

Google开源的端到端机器学习框架，支持构建和部署深度学习模型，广泛应用于CV、NLP、推荐系统等领域。

Stars: ⭐️ 195.6k
Tags: Deep Learning Machine Learning Neural Network
最后活动时间: 2026-06-12

ollama

轻量级本地大模型运行工具，支持Llama、Qwen、DeepSeek等多种开源模型，一键部署即开即用。

Stars: ⭐️ 173.9k
Tags: LLM Local Deployment Model Inference
最后活动时间: 2026-06-12

llama.cpp

高性能C/C++实现的LLM推理引擎，支持GGML格式，广泛用于本地部署。

Stars: ⭐️ 116.2k
Tags: 推理 C++ GGML
最后活动时间: 2026-06-12

pytorch

开源深度学习框架，提供强大的GPU加速和动态计算图支持，广泛应用于神经网络研究和生产环境。

Stars: ⭐️ 100.7k
Tags: Deep Learning Neural Network GPU
最后活动时间: 2026-06-12

fastapi

高性能异步Python Web框架，广泛用于AI模型API服务和生产部署。

Stars: ⭐️ 99.1k
Tags: fastapi api async python openapi
最后活动时间: 2026-06-10

vllm

高吞吐量LLM推理和服务引擎，采用PagedAttention技术优化显存利用率，广泛用于生产环境大模型部署。

Stars: ⭐️ 82.7k
Tags: LLM推理 模型服务 高性能
最后活动时间: 2026-06-12

keras

面向人类的深度学习框架，提供简洁高级的API，支持多后端包括TensorFlow和PyTorch。

Stars: ⭐️ 64.1k
Tags: 深度学习 Keras 神经网络
最后活动时间: 2026-06-12

litellm

统一LLM API网关和SDK，支持100+大模型API标准化调用，提供成本追踪、负载均衡等企业级功能。

Stars: ⭐️ 50.2k
Tags: AI Gateway LLM Proxy OpenAI Compatible
最后活动时间: 2026-06-12

LocalAI

免费开源的OpenAI API替代方案，支持本地部署无需GPU，兼容OpenAI API接口。

Stars: ⭐️ 46.8k
Tags: LLM Self-hosted OpenAI API Local Inference
最后活动时间: 2026-06-12

airflow

Apache旗下开源工作流编排平台，支持以代码方式定义、调度和监控数据管道与ML工作流，是MLOps领域的核心基础设施工具。

Stars: ⭐️ 45.8k
Tags: MLOps 工作流编排 数据管道
最后活动时间: 2026-06-12

exo

在本地运行前沿AI模型的分布式推理框架，支持多设备协同计算，无需GPU即可运行大语言模型。

Stars: ⭐️ 45.0k
Tags: local-ai llm distributed inference edge-computing
最后活动时间: 2026-05-28

ray

AI计算引擎，提供分布式运行时和AI库加速机器学习工作负载，支持深度学习、强化学习和LLM推理等场景。

Stars: ⭐️ 42.9k
Tags: 分布式计算 机器学习 LLM
最后活动时间: 2026-06-12

BitNet

微软官方推出的1-bit LLM推理框架，实现极致压缩的高效大模型部署。

Stars: ⭐️ 39.3k
Tags: 1-bit LLM Inference Compression Microsoft
最后活动时间: 2026-03-10

new-api

统一的AI模型聚合网关，支持将各类LLM转换为OpenAI/Claude/Gemini兼容格式，适合个人和企业的模型管理。

Stars: ⭐️ 38.5k
Tags: AI Gateway LLM OpenAI Compatible
最后活动时间: 2026-06-10

gym

OpenAI开发的强化学习算法开发与对比工具包，提供标准化的环境接口，支持多种经典控制、Atari游戏等环境，是RL研究的标准基准平台。

Stars: ⭐️ 37.2k
Tags: reinforcement-learning machine-learning openai simulation
最后活动时间: 2026-03-26

pytorch-image-models

最大的PyTorch图像编码器/骨干网络集合，包含ResNet、ViT、EfficientNet等预训练模型及训练推理脚本。

Stars: ⭐️ 36.8k
Tags: Computer Vision Pretrained Models PyTorch
最后活动时间: 2026-05-27

one-api

强大的LLM API管理与分发平台，统一OpenAI、Claude、Gemini等主流模型接口，支持Key管理与二次分发。

Stars: ⭐️ 34.9k
Tags: API Gateway Multi-Model Key Management
最后活动时间: 2026-01-09

detectron2

Facebook AI Research推出的下一代目标检测与分割平台，支持Mask R-CNN、RetinaNet等主流算法，模块化设计易于扩展。

Stars: ⭐️ 34.5k
Tags: object-detection segmentation computer-vision pytorch
最后活动时间: 2026-05-15

go-zero

云原生Go微服务框架，支持AI原生开发，提供代码生成和API网关功能，适合构建高性能AI服务后端。

Stars: ⭐️ 33.1k
Tags: microservices api-gateway go cloud-native
最后活动时间: 2026-06-12

sglang

高性能的大语言模型和多模态模型服务框架，专注于推理优化和高效部署，提供卓越的服务性能。

Stars: ⭐️ 28.9k
Tags: Inference LLM CUDA Serving
最后活动时间: 2026-06-12

mlflow

开源AI工程平台，支持调试、评估、监控和优化生产级AI应用，提供完整的机器学习生命周期管理。

Stars: ⭐️ 26.5k
Tags: MLOps LLMOps 模型管理
最后活动时间: 2026-06-12

kratos

云原生时代的 Go 微服务框架，支持 gRPC、HTTP 和 MCP 协议，内置 AI 能力。

Stars: ⭐️ 25.7k
Tags: microservices go grpc mcp cloud-native
最后活动时间: 2026-06-11

llamafile

Mozilla开源项目，将LLM打包为单一可执行文件，实现一键分发与运行。

Stars: ⭐️ 24.9k
Tags: LLM Deployment Portable
最后活动时间: 2026-06-09

Paddle

百度开源的工业级深度学习框架，支持高性能单机与分布式训练，提供跨平台部署能力。

Stars: ⭐️ 23.9k
Tags: deep-learning machine-learning neural-network distributed-training
最后活动时间: 2026-06-12

headroom

LLM应用上下文优化层，通过智能压缩技术解决上下文窗口限制，支持OpenAI、Anthropic等多种提供商。

Stars: ⭐️ 23.9k
Tags: Context Optimization Token Compression LLM Proxy
最后活动时间: 2026-06-12

mlc-llm

通用LLM部署引擎，通过机器学习编译技术实现跨平台高效推理，支持多种硬件后端。

Stars: ⭐️ 22.8k
Tags: LLM部署 模型编译 TVM 推理优化
最后活动时间: 2026-05-11

prefect

Python工作流编排框架，用于构建弹性的数据管道和ML工作流，支持可观测性与自动化。

Stars: ⭐️ 22.6k
Tags: Workflow Orchestration MLOps
最后活动时间: 2026-06-12

NemoClaw

在 NVIDIA OpenShell 中安全运行 OpenClaw 的托管推理方案，提供安全的模型推理环境。

Stars: ⭐️ 21.1k
Tags: nvidia inference openclaw security
最后活动时间: 2026-06-12

onnx

机器学习互操作的开放标准，支持PyTorch、TensorFlow等主流框架间的模型转换与跨平台部署，是AI生态的核心基础设施。

Stars: ⭐️ 21.0k
Tags: ONNX Interoperability Model Format
最后活动时间: 2026-06-11

openobserve

开源可观测性平台，支持日志、指标、追踪和LLM可观测性，存储成本比Elasticsearch低140倍。

Stars: ⭐️ 19.2k
Tags: observability llm monitoring logs metrics
最后活动时间: 2026-06-12

taipy

将数据和AI算法快速转化为生产级Web应用的Python框架，支持管道编排、数据可视化和场景分析。

Stars: ⭐️ 19.2k
Tags: Python MLOps Data Visualization Pipeline
最后活动时间: 2026-05-29

livekit

端到端实时通信基础设施，专为连接人类与AI设计，支持语音、视频和WebRTC通信。

Stars: ⭐️ 19.0k
Tags: realtime webrtc voice-ai media-server
最后活动时间: 2026-05-28

web-llm

基于WebGPU的浏览器端LLM推理引擎，无需服务器即可在浏览器中运行大模型，实现完全客户端AI推理。

Stars: ⭐️ 18.2k
Tags: WebGPU 浏览器AI 本地推理
最后活动时间: 2026-06-09

iii

统一后端架构引擎，通过Function、Trigger、Worker三个原语整合AI Agent与现有技术栈。

Stars: ⭐️ 18.0k
Tags: backend-framework agents genai primitives
最后活动时间: 2026-06-12

openfang

开源智能体操作系统，基于Rust构建，支持MCP协议，为AI智能体提供底层运行环境。

Stars: ⭐️ 17.8k
Tags: Agent OS MCP Rust
最后活动时间: 2026-05-14

brpc

百度开源的工业级RPC框架，广泛应用于搜索、存储、机器学习、广告推荐等高性能系统。

Stars: ⭐️ 17.5k
Tags: rpc c-plus-plus high-performance distributed-systems
最后活动时间: 2026-05-29

9router

统一路由工具，连接Claude Code、Cursor、Copilot等AI编程工具到40+服务商和100+模型，简化多模型接入。

Stars: ⭐️ 17.3k
Tags: AI Router Code Assistant Multi-Model API Gateway
最后活动时间: 2026-06-06

kubeflow

Kubernetes上的机器学习工具包，提供完整的ML工作流编排与模型部署能力。

Stars: ⭐️ 15.7k
Tags: kubernetes machine-learning ml-ops
最后活动时间: 2026-06-11

dagster

现代化数据资产编排平台，专为数据工程和机器学习工作流设计，支持数据管道的开发、部署与监控。

Stars: ⭐️ 15.7k
Tags: 数据编排 MLOps ETL
最后活动时间: 2026-06-11

burn

新一代Rust深度学习框架，兼顾灵活性、效率和可移植性，支持CUDA、Metal、Vulkan、WebGPU等多后端。

Stars: ⭐️ 15.4k
Tags: Deep-Learning Rust Cross-Platform
最后活动时间: 2026-06-11

nano-vllm

轻量级vLLM实现，专注于大语言模型的高效推理，适合学习和轻量级部署场景。

Stars: ⭐️ 14.0k
Tags: LLM 推理引擎 PyTorch
最后活动时间: 2026-04-26

casdoor

AI优先的身份认证与访问管理平台，支持MCP网关、OAuth 2.1、OIDC、SAML、LDAP等多种认证协议。

Stars: ⭐️ 13.8k
Tags: IAM MCP Gateway Authentication SSO
最后活动时间: 2026-06-11

or-tools

Google开源的运筹学优化工具套件，提供线性规划、约束规划、车辆路径等算法，广泛应用于AI优化问题。

Stars: ⭐️ 13.5k
Tags: optimization linear-programming operations-research
最后活动时间: 2026-05-28

tvm

开源机器学习编译器框架，支持跨平台GPU加速和深度学习模型优化部署。

Stars: ⭐️ 13.5k
Tags: machine-learning compiler deep-learning gpu tensor
最后活动时间: 2026-06-12

ds4

DeepSeek 4 Flash本地推理引擎，专为Metal优化的高性能推理框架，支持在本地快速运行DeepSeek模型。

Stars: ⭐️ 12.4k
Tags: deepseek inference-engine metal local-llm
最后活动时间: 2026-05-28

OpenLLM

开源大语言模型运行平台，支持将主流模型部署为OpenAI兼容的API端点，提供云端部署和服务管理的一站式解决方案。

Stars: ⭐️ 12.4k
Tags: LLM Inference OpenAI-Compatible
最后活动时间: 2026-06-08

claude-relay-service

一站式AI API中转服务，支持Claude、OpenAI、Gemini等多平台统一接入，降低使用成本。

Stars: ⭐️ 12.1k
Tags: API Relay Multi-Model Claude
最后活动时间: 2026-06-11

gateway

高性能AI网关，统一接入200+大语言模型和50+AI防护栏，提供单一API接口实现智能路由与安全管控。

Stars: ⭐️ 12.0k
Tags: AI-Gateway LLM Guardrails
最后活动时间: 2026-05-25

tensorzero

开源工业级LLM应用技术栈，集成LLM网关、可观测性、优化和评估功能，为生产级AI应用提供完整基础设施。

Stars: ⭐️ 11.5k
Tags: LLMOps LLM-Gateway Observability
最后活动时间: 2026-06-11

bisheng

开源企业级LLM DevOps平台，提供GenAI工作流、RAG、Agent、模型管理与微调等全方位功能。

Stars: ⭐️ 11.4k
Tags: LLM平台 RAG Agent 工作流
最后活动时间: 2026-06-12

wandb

AI开发者平台，提供模型训练跟踪、超参数调优和模型版本管理，从实验到生产的全流程MLOps解决方案。

Stars: ⭐️ 11.1k
Tags: MLOps Experiment Tracking Model Management
最后活动时间: 2026-06-12

kedro

生产级数据科学工具箱，采用软件工程最佳实践构建可复现、可维护的机器学习流水线。

Stars: ⭐️ 10.9k
Tags: MLOps 流水线 机器学习 Python
最后活动时间: 2026-06-12

text-generation-inference

HuggingFace官方推出的大语言模型生产级推理框架，支持BLOOM、Falcon等主流模型的高效部署，提供张量并行和流式输出等高级特性。

Stars: ⭐️ 10.9k
Tags: LLM Inference Deployment
最后活动时间: 2026-03-21

mistral-inference

Mistral AI官方推理库，提供高效的大模型推理能力支持。

Stars: ⭐️ 10.8k
Tags: LLM Inference Mistral Model Serving
最后活动时间: 2026-04-20

triton-inference-server

NVIDIA开源的云端和边缘推理服务器，提供优化的AI模型部署解决方案。

Stars: ⭐️ 10.8k
Tags: inference deep-learning gpu model-serving
最后活动时间: 2026-06-12

WasmEdge

轻量级高性能WebAssembly运行时，专为云原生、边缘计算和去中心化应用设计。支持AI模型推理、无服务器函数和微服务部署。

Stars: ⭐️ 10.6k
Tags: WebAssembly Runtime Edge AI Serverless
最后活动时间: 2026-06-12

yolov3

YOLOv3目标检测模型的PyTorch实现，支持导出至ONNX、CoreML、TFLite等多种格式，便于跨平台部署。

Stars: ⭐️ 10.6k
Tags: Object Detection YOLO PyTorch
最后活动时间: 2026-05-06

openvino

Intel开源的AI推理优化工具包，支持跨平台高性能部署计算机视觉、NLP和生成式AI模型。

Stars: ⭐️ 10.4k
Tags: 模型推理 优化部署 Intel
最后活动时间: 2026-06-12

runanywhere-sdks

生产级本地 AI 运行工具包，支持 Android、iOS、Web 多平台部署，集成 LLM、多模态、语音 AI 等端侧推理能力。

Stars: ⭐️ 10.3k
Tags: On-Device AI Cross-Platform Edge AI
最后活动时间: 2026-06-12

metaflow

Netflix开源的ML基础设施框架，支持分布式训练、LLM工作流和多云部署，提供完整的MLOps解决方案。

Stars: ⭐️ 10.1k
Tags: MLOps 分布式训练 LLM工作流
最后活动时间: 2026-06-11

pytorch3d

FAIR官方3D深度学习库，提供可复用的3D数据处理组件和渲染功能。

Stars: ⭐️ 9.9k
Tags: pytorch 3d-deep-learning point-cloud rendering
最后活动时间: 2026-06-11

freellmapi

OpenAI兼容的API代理服务，聚合14+AI提供商的免费额度并支持自动故障转移，适合个人实验与开发测试。

Stars: ⭐️ 9.8k
Tags: openai-compatible api-proxy llm free-tier
最后活动时间: 2026-06-11

PowerInfer

面向本地部署的高速大语言模型推理引擎，显著提升本地LLM服务性能。

Stars: ⭐️ 9.5k
Tags: LLM推理 本地部署 高性能
最后活动时间: 2026-05-11

cog

将机器学习模型打包成标准化容器的工具，支持CUDA和主流框架，简化AI模型的生产部署流程。

Stars: ⭐️ 9.4k
Tags: ML Ops Docker Model Deployment
最后活动时间: 2026-06-11

inference

一行代码替换GPT为任意大语言模型，支持云端、本地和多模态模型推理。

Stars: ⭐️ 9.3k
Tags: LLM推理 模型部署 OpenAI兼容
最后活动时间: 2026-06-12

coai

新一代多租户AI一站式解决方案，内置管理和计费系统。支持200+模型和35+提供商的企业级统一LLM网关，具备负载均衡、成本管理和文件解析等功能。

Stars: ⭐️ 9.2k
Tags: AI Gateway LLM Multi-tenant
最后活动时间: 2026-03-12

modelscope

阿里达摩院开源的模型即服务平台，提供丰富预训练模型库和Python SDK，覆盖CV、NLP、多模态等领域。

Stars: ⭐️ 9.0k
Tags: Model-as-a-Service Multi-modal Deep Learning
最后活动时间: 2026-06-11

vowpal_wabbit

微软开源的高性能机器学习系统，支持在线学习、强化学习、主动学习等多种前沿ML技术，适合大规模工业级应用场景。

Stars: ⭐️ 8.7k
Tags: machine-learning online-learning reinforcement-learning active-learning
最后活动时间: 2026-05-08

BentoML

一站式AI模型服务化平台，轻松构建推理API和LLM应用，支持生产级多模型管道部署。

Stars: ⭐️ 8.7k
Tags: 模型服务 MLOps LLM推理
最后活动时间: 2026-06-03

higress

AI原生API网关，专为AI应用设计，支持云原生架构和Envoy代理，提供高效的AI模型服务路由与管理能力。

Stars: ⭐️ 8.6k
Tags: ai-gateway api-gateway cloud-native envoy
最后活动时间: 2026-06-07

LMCache

为LLM提供极速KV缓存层，显著提升推理速度和吞吐量。支持vLLM、PyTorch等主流框架，兼容CUDA和ROCm。

Stars: ⭐️ 8.5k
Tags: KV Cache LLM Inference vLLM
最后活动时间: 2026-06-12

nexa-sdk

跨平台AI推理SDK，支持在GPU、NPU、CPU上运行前沿LLM和VLM模型，覆盖PC、移动端和Linux/IoT设备。

Stars: ⭐️ 8.1k
Tags: llm vlm sdk on-device-ai inference
最后活动时间: 2026-06-11

lmdeploy

高效的大语言模型压缩、部署和服务化工具包，支持多种主流LLM的推理加速与量化部署。

Stars: ⭐️ 7.9k
Tags: LLM推理 模型部署 量化压缩
最后活动时间: 2026-06-11

h2o-3

开源分布式机器学习平台，支持多种算法和AutoML自动建模功能，可扩展处理大规模数据。

Stars: ⭐️ 7.5k
Tags: 机器学习 AutoML 分布式计算
最后活动时间: 2026-06-12

qiskit

IBM开源量子计算SDK，支持量子电路、算子和原语级别的编程，为量子机器学习提供基础。

Stars: ⭐️ 7.4k
Tags: qiskit quantum-computing quantum-circuit sdk python
最后活动时间: 2026-05-28

mistral.rs

基于Rust的高性能LLM推理引擎，提供快速灵活的大语言模型部署能力。

Stars: ⭐️ 7.3k
Tags: LLM Inference Rust
最后活动时间: 2026-06-11

monty

用 Rust 编写的最小化安全 Python 解释器，专为 AI 代理代码执行设计。

Stars: ⭐️ 7.2k
Tags: python-interpreter rust ai-sandbox code-execution
最后活动时间: 2026-05-28

flax

基于JAX的神经网络库，专为灵活性和高性能深度学习研究设计。

Stars: ⭐️ 7.2k
Tags: jax flax neural-network deep-learning
最后活动时间: 2026-06-08

openllmetry

基于OpenTelemetry的GenAI/LLM应用可观测性开源方案，提供全面的监控和追踪能力。

Stars: ⭐️ 7.2k
Tags: Observability OpenTelemetry Monitoring
最后活动时间: 2026-06-11

tensorboard

TensorFlow官方可视化工具包，用于机器学习模型训练监控与分析。

Stars: ⭐️ 7.2k
Tags: tensorflow visualization machine-learning deep-learning
最后活动时间: 2026-05-22

dynamo

数据中心级分布式推理服务框架，专为大规模AI模型部署优化。

Stars: ⭐️ 7.1k
Tags: Distributed Inference Datacenter Model Serving
最后活动时间: 2026-05-28

flyte

动态弹性的AI工作流编排平台，用于协调数据、模型和计算资源，支持Kubernetes原生部署和LLM工作流管理。

Stars: ⭐️ 7.1k
Tags: Orchestration MLOps Kubernetes
最后活动时间: 2026-06-12

guardrails

为大语言模型添加安全护栏的框架，确保AI输出符合规范与安全要求。

Stars: ⭐️ 7.0k
Tags: LLM Safety Guardrails AI Security
最后活动时间: 2026-06-10

manifest

智能LLM路由方案，通过智能调度降低高达70%的API调用成本，支持可观测性监控。

Stars: ⭐️ 6.9k
Tags: LLM Router Cost Optimization Observability
最后活动时间: 2026-06-12

gemma.cpp

Google官方推出的轻量级C++推理引擎，专为Gemma大模型设计，支持本地高效部署和推理。

Stars: ⭐️ 6.9k
Tags: inference-engine gemma cpp llm local-deployment
最后活动时间: 2026-05-27

angel

腾讯开源的大规模机器学习参数服务器，支持高维模型训练和在线学习，与Spark生态深度集成。

Stars: ⭐️ 6.8k
Tags: machine-learning parameter-server distributed-systems scala
最后活动时间: 2026-06-08

clearml

一站式 MLOps/LLMOps 平台，提供实验管理、数据管理、流水线编排和模型服务。

Stars: ⭐️ 6.7k
Tags: mlops machine-learning deep-learning experiment-management
最后活动时间: 2026-06-10

zeppelin

基于 Web 的数据科学笔记本，支持 SQL、Scala、Spark 等多种语言，适用于大数据分析和 ML 工作流。

Stars: ⭐️ 6.6k
Tags: notebook big-data spark data-analytics visualization
最后活动时间: 2026-06-12

plano

面向智能体应用的AI原生代理和数据平面，内置编排、安全、可观测性和智能LLM路由功能。

Stars: ⭐️ 6.6k
Tags: ai-gateway llm-routing proxy
最后活动时间: 2026-06-09

ClawRouter

面向AI智能体原生的LLM路由器，支持41+模型且路由延迟低于1ms，集成USDC微支付功能。

Stars: ⭐️ 6.6k
Tags: LLM路由 AI Agents 微支付
最后活动时间: 2026-06-11

mmcv

OpenMMLab计算机视觉基础库，提供高质量的CV模型训练基础设施和通用组件。

Stars: ⭐️ 6.4k
Tags: computer-vision deep-learning pytorch openmmlab
最后活动时间: 2026-01-29

RWKV-Runner

仅8MB的RWKV模型管理启动工具，提供兼容OpenAI API接口，支持本地快速部署大模型。

Stars: ⭐️ 6.4k
Tags: RWKV LLM OpenAI-API 本地部署
最后活动时间: 2026-05-28

TensorFlow Serving

TensorFlow官方高性能模型服务系统，支持模型版本管理和多模型并行部署，专为生产环境设计。

Stars: ⭐️ 6.4k
Tags: TensorFlow 模型部署 生产环境
最后活动时间: 2026-06-11

greptimedb

开源可观测性数据库，统一存储指标、日志和追踪数据，支持AI/LLM监控场景。

Stars: ⭐️ 6.3k
Tags: Observability Database LLM Monitoring OpenTelemetry
最后活动时间: 2026-05-29

gpt-load

支持多渠道的AI代理服务，具备智能密钥轮询功能，轻松管理OpenAI、Claude、Gemini等多个AI提供商。

Stars: ⭐️ 6.2k
Tags: AI代理 密钥管理 多渠道
最后活动时间: 2026-05-29

OmniRoute

多提供商LLM智能网关，提供OpenAI兼容接口，支持智能路由、负载均衡、重试回退、策略限流和可观测性功能。

Stars: ⭐️ 6.1k
Tags: LLM Gateway Model Routing Rate Limiting
最后活动时间: 2026-06-12

helicone

开源LLM可观测性平台，一行代码即可实现AI应用的监控、评估和实验管理。

Stars: ⭐️ 5.8k
Tags: LLMOps Observability Monitoring OpenAI
最后活动时间: 2026-06-11

nuclio

高性能无服务器事件和数据处理平台，常用于AI模型实时推理和数据处理流水线。

Stars: ⭐️ 5.7k
Tags: serverless faas kubernetes model-serving real-time-inference
最后活动时间: 2026-06-10

bifrost

高性能企业级AI网关，比LiteLLM快50倍，支持1000+模型、自适应负载均衡和护栏功能。

Stars: ⭐️ 5.7k
Tags: ai-gateway load-balancing guardrails
最后活动时间: 2026-06-12

kserve

CNCF旗下标准化AI模型推理平台，支持在Kubernetes上部署生成式和预测式AI模型，提供企业级模型服务解决方案。

Stars: ⭐️ 5.6k
Tags: Kubernetes Model-Serving LLM-Inference
最后活动时间: 2026-06-12

Daft

高性能AI数据引擎，支持图像、音频、视频和结构化数据的大规模处理，专为AI和多模态工作负载优化。

Stars: ⭐️ 5.6k
Tags: Data Engine Multimodal Distributed Computing
最后活动时间: 2026-06-11

Mooncake

Moonshot AI开源的LLM推理服务平台，支持KVCache分离架构，为Kimi提供高性能推理服务。

Stars: ⭐️ 5.6k
Tags: 模型推理 KVCache RDMA
最后活动时间: 2026-06-12

kgateway

云原生API网关和AI网关，支持Kubernetes环境下的微服务和AI模型流量管理。

Stars: ⭐️ 5.6k
Tags: api-gateway ai-gateway kubernetes envoy
最后活动时间: 2026-06-12

composer

MosaicML推出的模型训练加速库，提供高效的深度学习训练优化方案。

Stars: ⭐️ 5.5k
Tags: deep-learning pytorch ml-training
最后活动时间: 2026-04-29

zenml

开源MLOps平台，用于构建可生产的机器学习管道和AI代理工作流，支持从实验到生产的全生命周期管理。

Stars: ⭐️ 5.4k
Tags: MLOps Pipeline LLMOps
最后活动时间: 2026-06-12

shimmy

基于Rust的高性能推理服务器，兼容OpenAI API，支持GGUF和SafeTensors格式，单二进制部署，支持热模型切换。

Stars: ⭐️ 5.4k
Tags: inference-server gguf openai-compatible rust llm-inference
最后活动时间: 2026-06-11

genai-stack

生成式AI技术栈，集成LangChain、Docker、Neo4j和Ollama，快速部署AI应用。

Stars: ⭐️ 5.3k
Tags: langchain ollama neo4j docker genai
最后活动时间: 2026-06-04

SynapseML

微软开源的分布式机器学习库，基于Apache Spark构建，支持深度学习、模型部署和认知服务集成。

Stars: ⭐️ 5.2k
Tags: Machine Learning Apache Spark Deep Learning Model Deployment
最后活动时间: 2026-06-10

vllm-omni

面向全模态模型的高效推理框架，支持图像、视频、音频等多模态内容的生成与服务。

Stars: ⭐️ 5.1k
Tags: Inference Multimodal Model Serving
最后活动时间: 2026-06-12

text-embeddings-inference

HuggingFace出品的高性能文本嵌入模型推理解决方案，支持大规模向量检索场景。

Stars: ⭐️ 4.9k
Tags: 嵌入模型 高性能推理 HuggingFace
最后活动时间: 2026-05-26

pomerium

身份感知访问代理，内置AI网关功能，支持零信任架构的安全AI模型访问管理与流量控制。

Stars: ⭐️ 4.8k
Tags: aigateway zero-trust identity-aware-proxy gateway
最后活动时间: 2026-06-12

aibrix

面向GenAI推理的高性价比可插拔基础设施组件。

Stars: ⭐️ 4.8k
Tags: llm-inference infrastructure genai model-serving
最后活动时间: 2026-05-29

seldon-core

Kubernetes 原生 MLOps 框架，支持大规模机器学习模型的打包、部署、监控和管理。

Stars: ⭐️ 4.8k
Tags: mlops kubernetes model-serving machine-learning
最后活动时间: 2026-03-23

whichllm

根据你的硬件配置找到最适合运行的本地LLM模型，基于真实基准测试排名，一键运行。

Stars: ⭐️ 4.6k
Tags: local-llm benchmarks ollama gpu
最后活动时间: 2026-06-11

exllamav2

高效的本地LLM推理库，针对消费级GPU优化，实现快速模型运行。

Stars: ⭐️ 4.5k
Tags: Inference Local LLM GPU
最后活动时间: 2026-03-04

CTranslate2

高效的Transformer模型推理引擎，支持量化优化和多平台加速，专为生产环境设计。

Stars: ⭐️ 4.5k
Tags: 推理引擎 量化 优化
最后活动时间: 2026-06-07

llama-swap

为本地LLM服务器提供可靠的模型切换能力，兼容OpenAI/Anthropic API格式。

Stars: ⭐️ 4.5k
Tags: Model Swapping llama.cpp vLLM
最后活动时间: 2026-06-12

rlm

递归语言模型的通用推理库，支持多种沙箱环境，即插即用。

Stars: ⭐️ 4.5k
Tags: inference language-models rlm
最后活动时间: 2026-06-06

PINTO_model_zoo

海量预训练模型库，支持TensorFlow、PyTorch、ONNX等主流框架格式互转，覆盖边缘部署全场景。

Stars: ⭐️ 4.4k
Tags: Model Conversion Edge Deployment ONNX
最后活动时间: 2026-06-07

lite.ai.toolkit

轻量级C++ AI推理工具箱，支持多种后端，内置100+模型包括目标检测、分割、Stable Diffusion等功能。

Stars: ⭐️ 4.4k
Tags: C++ ONNX TensorRT YOLO
最后活动时间: 2026-03-19

LMOps

支持LLM和多模态大模型AI能力落地的通用技术框架，涵盖提示工程与预训练优化。

Stars: ⭐️ 4.4k
Tags: LLM运维 多模态 提示工程
最后活动时间: 2026-06-10

open_model_zoo

OpenVINO 预训练深度学习模型库，提供高质量、极快推理的各类 AI 模型，支持 PyTorch、TensorFlow、ONNX 等格式。

Stars: ⭐️ 4.4k
Tags: deep-learning model-zoo openvino pretrained-models inference
最后活动时间: 2026-05-29

lemonade

本地AI应用发现与运行平台，支持GPU/NPU优化的LLM本地部署。

Stars: ⭐️ 4.3k
Tags: Local LLM GPU MCP Server
最后活动时间: 2026-06-12

semantic-router

系统级智能路由器，支持云端、数据中心和边缘场景的混合模型路由，集成语义分类、PII检测和提示词防护功能。

Stars: ⭐️ 4.3k
Tags: LLM路由 AI网关 Kubernetes
最后活动时间: 2026-06-12

mini-sglang

SGLang的精简实现版本，帮助开发者深入理解现代LLM服务系统的核心原理与架构设计。

Stars: ⭐️ 4.3k
Tags: LLM Serving Educational
最后活动时间: 2026-05-17

logfire

专为生产环境 LLM 和智能体系统设计的可观测性平台，基于 OpenTelemetry 标准提供日志、指标和追踪功能。

Stars: ⭐️ 4.3k
Tags: Observability LLM OpenTelemetry Monitoring
最后活动时间: 2026-06-12

axonhub

开源AI网关，支持100+大语言模型，内置故障转移、负载均衡、成本控制和端到端追踪功能。

Stars: ⭐️ 4.3k
Tags: AI Gateway LLM 负载均衡
最后活动时间: 2026-06-12

mcpo

简单安全的MCP到OpenAPI代理服务器，实现AI模型协议的无缝转换与对接。

Stars: ⭐️ 4.3k
Tags: MCP Proxy OpenAPI
最后活动时间: 2026-05-17

csghub

开源的LLM资产管理平台，类似Hugging Face的国产替代方案。支持模型、数据集、Agent的全生命周期管理，兼容HF SDK。

Stars: ⭐️ 4.2k
Tags: LLM平台 模型管理 开源
最后活动时间: 2026-06-10

optillm

LLM推理优化代理服务器，支持Chain-of-Thought、MoE、MCTS等优化策略，提升模型推理效率。

Stars: ⭐️ 4.1k
Tags: LLM Inference Optimization Proxy
最后活动时间: 2026-05-07

LightLLM

轻量级高性能LLM推理服务框架，基于Titon实现，支持灵活扩展和高吞吐量部署。

Stars: ⭐️ 4.1k
Tags: Inference Serving Triton
最后活动时间: 2026-06-12

GenerativeAIExamples

NVIDIA官方生成式AI参考工作流，针对GPU加速基础设施和微服务架构优化。企业级部署最佳实践。

Stars: ⭐️ 4.1k
Tags: GPU Acceleration Microservices LLM Inference
最后活动时间: 2026-05-29

dlrm

Meta开源的深度学习推荐模型实现，广泛应用于工业级推荐系统。

Stars: ⭐️ 4.0k
Tags: recommendation-system deep-learning pytorch meta
最后活动时间: 2026-01-12

LitServe

轻量级Python AI推理服务框架，支持自定义逻辑、批处理和弹性扩展。

Stars: ⭐️ 3.9k
Tags: model-serving inference api fastapi
最后活动时间: 2026-06-09

archestra

企业级AI平台，提供安全护栏、MCP注册中心、网关和编排器，适用于生产环境。

Stars: ⭐️ 3.8k
Tags: MCP Agent Enterprise Kubernetes
最后活动时间: 2026-06-12

iree

基于MLIR的机器学习编译器和运行时工具包，支持跨平台部署TensorFlow、PyTorch、JAX等模型。

Stars: ⭐️ 3.8k
Tags: MLIR Compiler Cross-Platform
最后活动时间: 2026-06-12

rocketride-server

高性能AI流水线引擎，采用C++核心与50+可扩展节点，支持多模型提供商和向量数据库的LLM工作流构建。

Stars: ⭐️ 3.8k
Tags: Pipeline Agent LLM C++
最后活动时间: 2026-06-12

lorax

多LoRA推理服务器，单GPU高效服务数千个微调模型，大幅降低部署成本。

Stars: ⭐️ 3.8k
Tags: LoRA LLM推理 模型服务
最后活动时间: 2026-05-28

maestro

Netflix开源的工作流编排器，支持机器学习流水线、MLOps和智能体工作流的自动化调度与管理。

Stars: ⭐️ 3.8k
Tags: Workflow MLOps Orchestration Data Pipelines
最后活动时间: 2026-06-12

atmosphere

JVM 平台的传输无关实时框架，支持 WebSocket、SSE、MCP 等多种协议的统一 API。

Stars: ⭐️ 3.8k
Tags: mcp websocket java spring-boot real-time
最后活动时间: 2026-06-12

RLinf

面向具身智能和智能体AI的强化学习基础设施框架，支持VLA-RL等前沿研究方向。

Stars: ⭐️ 3.8k
Tags: reinforcement-learning embodied-ai agentic-ai infrastructure
最后活动时间: 2026-06-12

antigravity-claude-proxy

代理工具，将Antigravity提供的Claude和Gemini模型暴露为标准API，支持Claude Code和OpenClaw使用。

Stars: ⭐️ 3.7k
Tags: Claude Gemini Proxy
最后活动时间: 2026-06-08

vidgear

高性能跨平台视频处理Python框架，支持实时流媒体、视频稳定和多线程处理。

Stars: ⭐️ 3.7k
Tags: video-processing streaming opencv ffmpeg
最后活动时间: 2026-05-18

local-ai-packaged

一站式本地AI运行包，整合Ollama、Supabase、n8n、Open WebUI等工具，轻松部署私有AI环境。

Stars: ⭐️ 3.7k
Tags: local-ai ollama docker self-hosted ai-tools
最后活动时间: 2026-05-25

FastDeploy

基于PaddlePaddle的高性能LLM/VLM推理部署工具包，提供高效的模型服务化能力。

Stars: ⭐️ 3.7k
Tags: LLM Serving Inference Deployment PaddlePaddle
最后活动时间: 2026-06-12

FastVideo

统一的视频生成推理与后训练加速框架，支持扩散模型蒸馏和高效推理优化。

Stars: ⭐️ 3.6k
Tags: 视频生成 推理加速 扩散模型
最后活动时间: 2026-05-27

timely-dataflow

Rust实现的模块化数据流处理框架，支持分布式计算和迭代算法，可用于机器学习数据管道和实时数据处理。

Stars: ⭐️ 3.6k
Tags: dataflow distributed-systems stream-processing rust
最后活动时间: 2026-05-23

singa

一个分布式深度学习平台，支持大规模模型训练与推理的高效部署。

Stars: ⭐️ 3.6k
Tags: deep-learning distributed machine-learning
最后活动时间: 2026-05-15

openai-gemini

无服务器代理，将Gemini API转换为OpenAI兼容格式，方便开发者统一调用。

Stars: ⭐️ 3.6k
Tags: Gemini OpenAI Proxy Serverless
最后活动时间: 2026-03-17

GraphScope

阿里巴巴开源的一站式大规模图计算系统，集成图分析、图计算和图神经网络能力，支持Gremlin查询语言。

Stars: ⭐️ 3.5k
Tags: Graph Computing Graph Neural Networks Big Data
最后活动时间: 2026-05-18

ccx

Claude、Codex和Gemini API的统一代理服务，简化多模型API调用。

Stars: ⭐️ 3.5k
Tags: claude gemini api-proxy llm
最后活动时间: 2026-06-11

unitycatalog

开源多模态数据与AI目录管理平台，统一管理企业AI资产。

Stars: ⭐️ 3.4k
Tags: catalog data-management ai-governance multi-modal enterprise
最后活动时间: 2026-05-27

deep-prove

极速证明ML模型推理的框架，专注于零知识机器学习(ZKML)领域。为AI模型提供可验证推理能力。

Stars: ⭐️ 3.4k
Tags: zkml zk-snarks machine-learning ai-inference
最后活动时间: 2026-05-31

llm-d

专注于在Kubernetes上实现大语言模型高性能推理的部署框架，支持现代加速器以达成业界领先的推理性能。

Stars: ⭐️ 3.3k
Tags: Kubernetes LLM Inference High Performance
最后活动时间: 2026-06-12

agentgateway

新一代AI代理网关，支持MCP服务器和AI代理的代理与路由。

Stars: ⭐️ 3.2k
Tags: ai-gateway mcp agents kubernetes rust
最后活动时间: 2026-06-12

onnx-tensorrt

ONNX模型的TensorRT后端，实现高性能深度学习推理部署。

Stars: ⭐️ 3.2k
Tags: onnx tensorrt deep-learning nvidia inference
最后活动时间: 2026-06-02

neo

AI原生应用运行时引擎，支持多线程和持久化场景图，实现智能体实时内省与动态修改。

Stars: ⭐️ 3.2k
Tags: AI Runtime Agent Framework Multi-threaded
最后活动时间: 2026-06-12

opyrator

将机器学习代码快速转换为微服务，自动生成Web API和交互式GUI界面。

Stars: ⭐️ 3.1k
Tags: deployment fastapi machine-learning
最后活动时间: 2026-06-04

chitu

高性能大语言模型推理框架，专注于效率、灵活性和可用性，支持DeepSeek等主流模型的高效部署。

Stars: ⭐️ 3.1k
Tags: LLM Inference GPU Model Serving
最后活动时间: 2026-06-12

graphjin

自动编译器，将AI应用与数据库无缝连接，支持多种数据库后端。

Stars: ⭐️ 3.1k
Tags: database graphql sql api
最后活动时间: 2026-06-11

cake

分布式推理框架，支持移动端、桌面和服务器端的AI模型推理部署。

Stars: ⭐️ 3.1k
Tags: Distributed Inference Model Serving Cross-Platform
最后活动时间: 2026-04-24

docker-agent

AI智能体构建与运行时平台，借助Docker容器化优势，让Agent的构建、测试和生产部署更加简单高效。

Stars: ⭐️ 3.1k
Tags: Docker Runtime Deployment
最后活动时间: 2026-06-12

claude-code-hub

Claude Code与Codex API代理服务，提供智能负载均衡、用户管理和使用统计。

Stars: ⭐️ 3.0k
Tags: Claude API Proxy Load Balancing
最后活动时间: 2026-06-12

algernon

一个轻量级的纯Go Web服务器，内置Ollama支持，可便捷部署和运行本地LLM服务。

Stars: ⭐️ 3.0k
Tags: Go Ollama Web Server LLM Serving
最后活动时间: 2026-05-28

weld

斯坦福开源的高性能数据分析运行时，通过LLVM代码生成优化Pandas、Spark等数据框架的执行效率。

Stars: ⭐️ 3.0k
Tags: data-analytics llvm performance rust machine-learning
最后活动时间: 2026-04-13

lmnr

专为AI智能体打造的开源可观测性平台，提供全链路追踪、评估和监控能力，YC S24孵化项目。

Stars: ⭐️ 3.0k
Tags: 可观测性 LLMOps 监控
最后活动时间: 2026-06-12

TensorRT

NVIDIA官方的PyTorch模型编译器，利用TensorRT优化深度学习模型在GPU上的推理性能。

Stars: ⭐️ 3.0k
Tags: tensorrt deep-learning inference nvidia pytorch
最后活动时间: 2026-06-12

spiceai

Rust 编写的便携式加速 SQL 查询、搜索和 LLM 推理引擎，为数据驱动的 AI 应用和智能体提供基础设施支持。

Stars: ⭐️ 3.0k
Tags: SQL LLM推理 数据联邦 Rust
最后活动时间: 2026-06-12

distributed-llama

分布式LLM推理框架，可将多台家用设备连接成集群加速大模型推理，设备越多推理越快。

Stars: ⭐️ 2.9k
Tags: 分布式推理 集群计算 LLM
最后活动时间: 2026-04-14

ultralyticsPro

YOLO系列目标检测模型改进合集，支持YOLO11/v8/v10/v7/v5及RT-DETR等模型优化。

Stars: ⭐️ 2.9k
Tags: yolo object-detection pytorch deep-learning
最后活动时间: 2025-12-15

tract

轻量级、自包含的TensorFlow和ONNX推理引擎，使用Rust编写，适合嵌入式和边缘部署。

Stars: ⭐️ 2.9k
Tags: Rust ONNX TensorFlow 推理引擎
最后活动时间: 2026-06-12

sail

LakeSail推出的统一计算框架，将批处理、流处理和AI计算密集型工作负载整合在一起，基于Rust和Apache Arrow构建。

Stars: ⭐️ 2.9k
Tags: artificial-intelligence machine-learning data-engineering distributed-computing
最后活动时间: 2026-06-12

uvicorn-gunicorn-fastapi-docker

高性能FastAPI生产级Docker镜像，集成Uvicorn和Gunicorn，支持自动性能调优。

Stars: ⭐️ 2.9k
Tags: fastapi docker model-serving python asgi
最后活动时间: 2026-05-22

ramalama

基于容器技术的AI模型部署工具，简化本地服务和生产环境推理，支持llama.cpp、vLLM等多种引擎。

Stars: ⭐️ 2.9k
Tags: 容器化 模型部署 推理引擎
最后活动时间: 2026-06-11

cc-gateway

AI API身份网关，作为反向代理标准化设备指纹和遥测数据，实现隐私保护的API代理服务。

Stars: ⭐️ 2.9k
Tags: api-gateway anthropic claude privacy reverse-proxy
最后活动时间: 2026-04-02

one-hub

OpenAI接口管理与分发系统，支持多模型接入、统计页面及函数调用完善。

Stars: ⭐️ 2.8k
Tags: openai-api api-gateway model-management chatgpt
最后活动时间: 2026-02-19

infinity

高性能文本嵌入和重排序模型服务引擎，支持CLIP、CLAP和ColPali等多种模型。

Stars: ⭐️ 2.8k
Tags: Text Embeddings Model Serving Reranking
最后活动时间: 2026-03-24

leptonai

Pythonic框架，简化AI服务的构建与部署流程，提供高效的模型服务化解决方案。

Stars: ⭐️ 2.8k
Tags: ai-serving deep-learning gpu python deployment
最后活动时间: 2026-06-12

Model-Optimizer

统一的模型优化库，集成量化、剪枝、蒸馏、投机解码等SOTA技术，支持TensorRT-LLM、vLLM等部署框架，显著提升推理速度。

Stars: ⭐️ 2.8k
Tags: Model Optimization Quantization Inference
最后活动时间: 2026-05-29

Rapid-MLX

Apple Silicon上最快的本地AI推理引擎，比Ollama快4.2倍，支持工具调用和OpenAI API替换。

Stars: ⭐️ 2.8k
Tags: mlx llm-inference apple-silicon openai-api tool-calling local-llm
最后活动时间: 2026-06-12

torch-points3d

点云深度学习PyTorch框架，支持PointNet、KPConv等主流架构和分割任务。

Stars: ⭐️ 2.7k
Tags: point-cloud pytorch deep-learning segmentation
最后活动时间: 2026-05-25

BigDL

分布式深度学习框架，支持在Apache Spark/Flink和Ray上运行TensorFlow、Keras和PyTorch。

Stars: ⭐️ 2.7k
Tags: deep-learning distributed tensorflow pytorch spark
最后活动时间: 2026-06-12

secretflow

隐私保护数据分析与机器学习统一框架，支持联邦学习、差分隐私和安全多方计算。

Stars: ⭐️ 2.7k
Tags: privacy-preserving federated-learning differential-privacy secure-computation
最后活动时间: 2026-04-24

neural-compressor

Intel 开发的 SOTA 模型压缩工具，支持 INT8/FP8/INT4 等低比特量化、稀疏化和剪枝，优化 LLM 在各种硬件上的部署效率。

Stars: ⭐️ 2.7k
Tags: Quantization LLM Model Compression Intel
最后活动时间: 2026-06-12

metapi

AI API 聚合网关工具，将多个 AI API 服务（如 New API、One API 等）统一汇聚为单一入口，支持自动发现模型、智能路由和成本优化。

Stars: ⭐️ 2.6k
Tags: ai-api api-gateway model-routing openai-compatible
最后活动时间: 2026-05-24

aimet

高通开源的神经网络模型优化库，提供先进的量化和压缩技术，支持模型剪枝与部署优化。

Stars: ⭐️ 2.6k
Tags: quantization compression deep-learning pruning neural-network
最后活动时间: 2026-06-11

krakend-ce

高性能API网关，专为AI模型服务设计，支持GraphQL、微服务架构和云原生部署。

Stars: ⭐️ 2.6k
Tags: ai-gateway api-gateway go microservice graphql
最后活动时间: 2026-06-05

claude-code-proxy

Claude Code 到 OpenAI API 的代理转换工具，实现接口兼容。

Stars: ⭐️ 2.6k
Tags: claude-code openai proxy api
最后活动时间: 2026-03-12

neural-compressor

Intel 开发的 SOTA 模型压缩工具，支持 INT8/FP8/INT4 等低比特量化、稀疏化和剪枝，优化 LLM 在各种硬件上的部署效率。

Stars: ⭐️ 2.6k
Tags: Quantization LLM Model Compression Intel
最后活动时间: 2026-04-24

connector-x

高性能数据库到DataFrame数据加载库，支持Rust和Python，为机器学习数据管道提供极速数据读取能力。

Stars: ⭐️ 2.6k
Tags: database dataframe python rust sql
最后活动时间: 2026-05-25

needle

仅26M参数的函数调用模型，专为超小型设备设计的端侧AI解决方案。

Stars: ⭐️ 2.6k
Tags: llm on-device-ai edge-ai small-model
最后活动时间: 2026-05-16

deepdetect

C++14深度学习API服务器，支持PyTorch、TensorRT、TensorFlow等多框架模型部署。

Stars: ⭐️ 2.5k
Tags: deep-learning pytorch tensorrt model-serving
最后活动时间: 2026-06-12

LiteRT

Google端侧AI框架，TensorFlow Lite继任者，支持边缘平台高性能ML与GenAI部署。

Stars: ⭐️ 2.5k
Tags: edge-ai on-device-ml tensorflow-lite model-deployment
最后活动时间: 2026-06-12

faer-rs

Rust语言的高性能线性代数基础库，为机器学习和科学计算提供核心数学运算支持。

Stars: ⭐️ 2.5k
Tags: linear-algebra matrix rust machine-learning
最后活动时间: 2026-05-03

tensorflow-onnx

TensorFlow、Keras、TensorFlow.js和TFLite模型转换为ONNX格式的官方工具。

Stars: ⭐️ 2.5k
Tags: onnx tensorflow keras model-conversion deep-learning
最后活动时间: 2026-06-02

hamilton

Apache项目，帮助定义可测试、模块化的数据流，支持ML/LLM工作流编排与血缘追踪。

Stars: ⭐️ 2.5k
Tags: Dataflow MLOps ETL
最后活动时间: 2026-06-10

openlit

OpenTelemetry原生AI工程平台，提供LLM可观测性、GPU监控、护栏和提示词管理等一站式解决方案。

Stars: ⭐️ 2.5k
Tags: LLM Observability OpenTelemetry AI Engineering
最后活动时间: 2026-06-12

tensorflow-federated

Google开源的去中心化机器学习框架，支持在分布式数据上进行模型训练与推理。

Stars: ⭐️ 2.4k
Tags: federated-learning tensorflow decentralized-ml
最后活动时间: 2026-06-08

AIstudioProxyAPI

兼容OpenAI API格式的Google AI Studio代理服务，支持参数转发和调试WebUI面板。

Stars: ⭐️ 2.4k
Tags: google-ai-studio proxy openai-api middleware
最后活动时间: 2026-04-22

metamcp

一体化MCP聚合网关，集成编排、中间件和代理功能，支持Docker一键部署。

Stars: ⭐️ 2.4k
Tags: MCP Gateway Orchestration
最后活动时间: 2026-06-12

EAGLE

推测解码官方实现，显著加速大语言模型推理(ICML/EMNLP/NeurIPS系列论文)。

Stars: ⭐️ 2.4k
Tags: speculative-decoding llm-inference inference-acceleration
最后活动时间: 2026-02-20

ailia-models

ailia SDK 的预训练模型集合，涵盖图像分类、目标检测、姿态估计等多种 SOTA 模型。

Stars: ⭐️ 2.3k
Tags: Pre-trained Models Inference Multi-task
最后活动时间: 2026-06-11

folib

全语言制品仓库，支持Huggingface等主流AI模型仓库的代理与同步。

Stars: ⭐️ 2.3k
Tags: aimodels artifact-repository huggingface docker-registry maven
最后活动时间: 2025-12-24

Olive

微软开源的ML模型优化工具，简化模型微调、量化、转换和部署流程，支持CPU/GPU/NPU。

Stars: ⭐️ 2.3k
Tags: model-optimization quantization finetuning onnx
最后活动时间: 2026-06-11

langserve

LangChain官方部署工具，将LangChain应用快速打包为生产级REST API服务。

Stars: ⭐️ 2.3k
Tags: LangChain Deployment FastAPI LLM
最后活动时间: 2026-05-05

ort

Rust 语言实现的高性能 ONNX 模型推理和训练框架。

Stars: ⭐️ 2.3k
Tags: onnx inference rust machine-learning ai-training
最后活动时间: 2026-06-12

inference

计算机视觉推理服务器，支持YOLO等模型在边缘设备上的部署。

Stars: ⭐️ 2.3k
Tags: computer-vision inference object-detection yolo
最后活动时间: 2026-06-12

instill-core

全栈AI基础设施工具，提供数据、模型和流水线编排能力，支持低代码方式快速构建AI应用。

Stars: ⭐️ 2.3k
Tags: AI基础设施 流水线编排 低代码
最后活动时间: 2026-06-01

gluon-api

简洁高效的深度学习API框架，提供清晰易用的神经网络开发接口。

Stars: ⭐️ 2.3k
Tags: deep-learning neural-network api framework
最后活动时间: 2026-01-14

production-stack

vLLM官方Kubernetes集群部署方案，提供生产级LLM推理服务部署与性能优化。

Stars: ⭐️ 2.3k
Tags: vllm kubernetes llm-serving inference production
最后活动时间: 2026-04-23

CGraph

跨平台无依赖的C++/Python并行计算DAG框架，适用于AI工作流和Agent流水线编排。

Stars: ⭐️ 2.3k
Tags: dag pipeline workflow ai-agents parallel-computing
最后活动时间: 2026-05-10

fairlearn

评估和改进机器学习模型公平性的Python库，促进负责任AI发展。

Stars: ⭐️ 2.3k
Tags: fairness responsible-ai machine-learning python
最后活动时间: 2026-06-12

aurora

免费GPT API访问服务，提供便捷的AI模型调用能力。

Stars: ⭐️ 2.3k
Tags: chatgpt gpt free-api openai
最后活动时间: 2026-06-09

cc-mirror

创建多个隔离的 Claude Code 变体，支持 Z.ai、MiniMax、OpenRouter 等自定义提供商。

Stars: ⭐️ 2.2k
Tags: claude-code multi-provider proxy
最后活动时间: 2026-03-06

octopus

个人LLM API聚合服务，统一接入多种大语言模型。

Stars: ⭐️ 2.2k
Tags: ai ai-gateway anthropic claude openai
最后活动时间: 2026-05-28

kalosm

Rust编写的本地AI模型运行框架，支持即时部署和可控推理，涵盖LLM、语音识别等多种预训练模型。

Stars: ⭐️ 2.2k
Tags: rust llm local-ai whisper llama
最后活动时间: 2026-06-12

openrelay

免费AI模型代理服务，提供数百个免费模型配额，支持一键接入本地项目，兼容多种主流AI工具和IDE。

Stars: ⭐️ 2.2k
Tags: ai-proxy llm-proxy model-router openai claude
最后活动时间: 2026-05-15

floneum

Rust编写的本地AI模型推理框架，支持即时、可控的预训练模型运行。

Stars: ⭐️ 2.2k
Tags: Rust LLM Local AI Whisper
最后活动时间: 2026-05-23

tfx

TensorFlow Extended 端到端生产级 ML 流水线平台，支持模型训练、验证和部署全流程。

Stars: ⭐️ 2.2k
Tags: tensorflow mlops ml-pipeline production
最后活动时间: 2026-06-03

dify-plus

Dify企业级增强版，集成管理中心并针对企业场景优化。

Stars: ⭐️ 2.2k
Tags: dify enterprise llm-platform ai-platform
最后活动时间: 2026-04-25

mcphub

MCP服务器统一管理平台，支持多服务器动态编排、灵活路由策略和端点分发。

Stars: ⭐️ 2.2k
Tags: mcp mcp-gateway mcp-router orchestration
最后活动时间: 2026-06-11

llama2.mojo

使用纯Mojo语言实现的Llama 2推理引擎，单文件高效运行，支持SIMD和向量化加速。

Stars: ⭐️ 2.1k
Tags: Mojo Llama2 Inference Performance
最后活动时间: 2026-02-09

subnet-2

基于Bittensor的去中心化可验证AI推理网络，利用零知识证明技术确保推理结果的可信度与透明性。

Stars: ⭐️ 2.1k
Tags: bittensor zkml inference blockchain
最后活动时间: 2026-05-28

OnnxStream

轻量级ONNX推理库，支持在树莓派Zero 2上运行SDXL，支持Mistral、Whisper等多种模型。

Stars: ⭐️ 2.1k
Tags: ONNX Edge AI Stable Diffusion WASM
最后活动时间: 2026-01-20

WAAS

Whisper即服务工具，提供GUI界面和带队列管理的API服务。

Stars: ⭐️ 2.1k
Tags: whisper api gui speech-to-text service
最后活动时间: 2026-05-20

llama_deploy

LlamaIndex 官方部署工具，将智能体工作流快速部署到生产环境。

Stars: ⭐️ 2.1k
Tags: agents deployment llamaindex llm multi-agents
最后活动时间: 2026-04-06

diffrax

基于JAX的可微分数值微分方程求解器，支持GPU加速与自动微分。

Stars: ⭐️ 2.0k
Tags: jax differential-equations neural-differential-equations
最后活动时间: 2026-06-02

spikingjelly

基于PyTorch的开源脉冲神经网络(SNN)深度学习框架，支持神经形态计算。

Stars: ⭐️ 2.0k
Tags: 脉冲神经网络 PyTorch 深度学习框架
最后活动时间: 2026-06-09

deepmd-kit

基于深度学习的分子动力学模拟框架，用于多体势能表示和材料科学计算，支持多种深度学习框架后端。

Stars: ⭐️ 2.0k
Tags: Deep Learning Molecular Dynamics Computational Chemistry
最后活动时间: 2026-06-12

iris.c

FLUX.2图像生成模型的纯C语言推理实现，轻量高效。

Stars: ⭐️ 1.9k
Tags: flux inference c-language image-generation
最后活动时间: 2026-02-13

LLMRouter

开源LLM路由库，智能分配请求到最适合的模型，优化成本与性能平衡。

Stars: ⭐️ 1.9k
Tags: llm routing model-selection optimization
最后活动时间: 2026-05-13

opacus

PyTorch差分隐私训练库，支持在保护数据隐私的前提下训练深度学习模型。

Stars: ⭐️ 1.9k
Tags: differential-privacy pytorch privacy-preserving-ml
最后活动时间: 2026-05-20

petastorm

支持从Parquet格式数据集进行单机或分布式深度学习模型训练的库。

Stars: ⭐️ 1.9k
Tags: parquet deep-learning tensorflow pytorch
最后活动时间: 2026-01-02

flexflow-train

自动发现分布式深度神经网络训练的快速并行化策略，优化大规模模型训练效率。

Stars: ⭐️ 1.9k
Tags: distributed-training deep-learning parallelization neural-network
最后活动时间: 2026-06-08

toolhive

企业级MCP服务器运行管理平台，专注于AI安全与基础设施部署，支持Kubernetes环境。

Stars: ⭐️ 1.9k
Tags: MCP AI Security Kubernetes
最后活动时间: 2026-06-12

torch-mlir

连接PyTorch生态与MLIR生态的编译器基础设施，优化模型部署流程。

Stars: ⭐️ 1.8k
Tags: pytorch mlir compiler model-deployment
最后活动时间: 2026-06-12

codex-lb

ChatGPT/Codex多账号负载均衡代理工具，支持用量追踪、仪表盘和OpenCode兼容端点。

Stars: ⭐️ 1.8k
Tags: load-balancer openai chatgpt api-proxy dashboard
最后活动时间: 2026-06-11

TensorRT-YOLO

NVIDIA TensorRT加速的YOLO模型部署工具包，支持多版本YOLO模型的高效推理部署。

Stars: ⭐️ 1.8k
Tags: tensorrt yolo object-detection inference
最后活动时间: 2026-03-22

nndeploy

简单易用且高性能的 AI 部署框架，支持 TensorRT、ONNXRuntime、OpenVINO 等多种推理后端和低代码工作流编排。

Stars: ⭐️ 1.8k
Tags: 部署框架 TensorRT 多后端 LLM
最后活动时间: 2026-04-25

aioway

基于RDBMS理念的深度学习框架，支持声明式、可解释、可扩展的模型部署。

Stars: ⭐️ 1.8k
Tags: deep-learning pytorch scalable
最后活动时间: 2026-06-12

gollama

Go语言编写的Ollama模型管理工具，支持模型查看、删除等操作。

Stars: ⭐️ 1.8k
Tags: ollama llm gguf tui
最后活动时间: 2025-12-30

dreamfactory

企业级API平台，提供安全的数据访问接口，支持本地部署LLM的API连接与角色权限管理。

Stars: ⭐️ 1.8k
Tags: api rest openapi laravel
最后活动时间: 2026-06-10

aphrodite-engine

大规模LLM推理引擎，支持CUDA、ROCm、TPU等多种硬件加速，具备LoRA和推测解码等高级特性。

Stars: ⭐️ 1.8k
Tags: inference-engine llm cuda rocm tpu lora
最后活动时间: 2026-05-08

APIPark

云原生高性能AI网关平台，统一管理OpenAI、Claude、DeepSeek等主流大模型API，提供负载均衡和灾备功能。

Stars: ⭐️ 1.8k
Tags: AI Gateway LLM Gateway API Management
最后活动时间: 2026-05-06

ai-gateway

基于Envoy Gateway构建的AI网关，统一管理生成式AI服务访问，支持多LLM提供商接入。

Stars: ⭐️ 1.7k
Tags: AI Gateway Envoy LLM
最后活动时间: 2026-06-11

aphrodite-engine

大规模LLM推理引擎，支持CUDA、TPU、ROCm等多种硬件加速和推测解码。

Stars: ⭐️ 1.7k
Tags: inference-engine llm cuda tpu lora speculative-decoding
最后活动时间: 2026-05-08

OpenMLDB

面向机器学习的特征工程数据库，提供训练推理一致性特征计算。

Stars: ⭐️ 1.7k
Tags: feature-store machine-learning-database mlops feature-engineering
最后活动时间: 2026-06-09

katib

Kubernetes上的自动化机器学习平台，支持超参数调优和神经架构搜索，适用于大规模ML部署。

Stars: ⭐️ 1.7k
Tags: AutoML Kubernetes MLOps
最后活动时间: 2026-06-05

kubernetes-mcp-server

为 Kubernetes 和 OpenShift 提供的 MCP 服务器，让 AI Agent 能够管理容器编排。

Stars: ⭐️ 1.7k
Tags: mcp mcp-server kubernetes openshift containers
最后活动时间: 2026-06-10

mlrun

开源MLOps平台，用于快速构建和管理ML应用全生命周期，支持自动化ML流水线、模型服务和CI/CD集成。

Stars: ⭐️ 1.7k
Tags: MLOps Kubernetes Model-Serving
最后活动时间: 2026-06-11

beta9

超快速无服务器GPU推理平台，专为AI/ML工作负载设计，支持自动扩缩容。

Stars: ⭐️ 1.7k
Tags: Serverless GPU LLM推理
最后活动时间: 2026-06-12

TabPy

Tableau的Python集成框架，支持在Tableau可视化中实时执行Python代码和机器学习模型。

Stars: ⭐️ 1.6k
Tags: tableau python analytics model-serving
最后活动时间: 2026-04-21

uzu

高性能AI模型推理引擎，使用Rust编写，支持Metal加速。

Stars: ⭐️ 1.6k
Tags: Inference Rust High-Performance
最后活动时间: 2026-06-12

BiSeNet

双向分割网络实现，支持TensorRT、NCNN等多种推理框架部署。

Stars: ⭐️ 1.6k
Tags: semantic-segmentation pytorch tensorrt onnx
最后活动时间: 2026-04-04

LlamaEdge

在本地或边缘设备上运行定制化和微调LLM的最快方式，支持Wasm运行时。

Stars: ⭐️ 1.6k
Tags: llm edge-computing wasm model-serving
最后活动时间: 2026-02-08

PaddleSlim

飞桨深度学习模型压缩与架构搜索库，支持剪枝、量化、蒸馏、NAS等多种模型优化技术。

Stars: ⭐️ 1.6k
Tags: model-compression quantization pruning nas
最后活动时间: 2026-01-04

graalpython

高性能可嵌入的Python 3运行时，专为Java环境设计，支持在Java应用中运行Python AI/ML模型。

Stars: ⭐️ 1.6k
Tags: graalvm python java embeddable
最后活动时间: 2026-06-12

paddler

开源LLM负载均衡和服务平台，支持CPU/GPU自托管大规模部署，基于ggml生态构建，部署简单。

Stars: ⭐️ 1.6k
Tags: 负载均衡 LLM部署 自托管
最后活动时间: 2026-06-11

CompressAI

端到端压缩研究平台，提供PyTorch库和评估工具。

Stars: ⭐️ 1.6k
Tags: compression deep-learning pytorch
最后活动时间: 2026-06-11

Genie-TTS

GPT-SoVITS ONNX推理引擎与模型转换器，支持高效语音合成模型部署。

Stars: ⭐️ 1.6k
Tags: tts onnx voice-cloning gpt-sovits
最后活动时间: 2026-04-18

inference

MLPerf推理基准参考实现，提供机器学习模型推理性能的标准化评测。

Stars: ⭐️ 1.6k
Tags: mlperf inference benchmark machine-learning
最后活动时间: 2026-06-10

react-native-executorch

基于ExecuTorch的React Native端侧AI推理框架，支持LLM、OCR、语音等多种模型。

Stars: ⭐️ 1.6k
Tags: executorch react-native on-device-ai llm-inference ocr
最后活动时间: 2026-06-12

turboquant

面向LLM推理的近最优KV缓存量化方案，支持3-bit键和2-bit值量化，集成Triton内核与vLLM。

Stars: ⭐️ 1.5k
Tags: llm quantization kv-cache inference triton vllm
最后活动时间: 2026-03-27

mleap

ML管道生产部署工具，支持将Spark和scikit-learn模型导出为可移植格式，实现跨平台推理。

Stars: ⭐️ 1.5k
Tags: model-deployment spark production
最后活动时间: 2026-03-10

streaming

高效神经网络训练的数据流库，支持大规模数据集流式处理。

Stars: ⭐️ 1.5k
Tags: streaming deep-learning pytorch dataset
最后活动时间: 2026-02-02

codex2api

Codex2API 是一个基于 Go + Gin + React/Vite 的 Codex 反向代理与管理后台，支持 API 转发和额度管理。

Stars: ⭐️ 1.5k
Tags: api-proxy codex reverse-proxy infrastructure
最后活动时间: 2026-06-11

tensorstore

用于高效读写大型多维数组的库，专为机器学习和科学计算场景优化，支持大规模张量数据存储。

Stars: ⭐️ 1.5k
Tags: tensor storage machine-learning data-structures numpy
最后活动时间: 2026-04-14

geomstats

流形几何结构上的计算与统计库，支持黎曼几何深度学习应用。

Stars: ⭐️ 1.5k
Tags: riemannian-geometry manifold deep-learning machine-learning statistics
最后活动时间: 2026-05-28

mmengine

OpenMMLab 深度学习模型训练基础库，提供统一的训练框架。

Stars: ⭐️ 1.5k
Tags: ai deep-learning pytorch computer-vision
最后活动时间: 2025-12-23

bittensor

去中心化机器学习网络，构建互联网规模的神经网络基础设施，支持P2P协作训练。

Stars: ⭐️ 1.5k
Tags: decentralized-ai machine-learning neural-networks blockchain p2p
最后活动时间: 2026-06-12

spark-vllm-docker

双DGX Spark环境下的VLLM推理引擎Docker配置，专为高性能大模型推理部署优化。

Stars: ⭐️ 1.5k
Tags: vllm llm-inference docker gpu
最后活动时间: 2026-05-26

AMD-SHARK-Studio

基于SHARK+IREE的高性能机器学习部署Web UI，支持AMD/Apple/NVIDIA多平台。

Stars: ⭐️ 1.5k
Tags: ml-deployment iree mlir cross-platform
最后活动时间: 2025-12-15

gomlx

Go语言加速机器学习框架，支持高性能ML模型训练与推理。

Stars: ⭐️ 1.4k
Tags: go golang machine-learning xla
最后活动时间: 2026-06-12

mcp-gateway

Docker MCP CLI插件和网关，用于连接AI模型与外部工具和数据源的Model Context Protocol协议实现。

Stars: ⭐️ 1.4k
Tags: mcp docker ai-gateway model-context-protocol
最后活动时间: 2026-06-05

concrete-ml

隐私保护机器学习框架，基于全同态加密技术，支持在加密数据上进行模型推理。

Stars: ⭐️ 1.4k
Tags: machine-learning privacy homomorphic-encryption scikit-learn
最后活动时间: 2026-02-17

agentapi

为 Claude Code、Goose、Aider、Gemini、Amp、Codex 提供统一的 HTTP API 接口。

Stars: ⭐️ 1.4k
Tags: api claude-code codex gemini aider
最后活动时间: 2026-05-27

tokenspeed

极速LLM推理引擎，专为光速推理优化，支持DeepSeek、Qwen、Kimi等主流大模型。

Stars: ⭐️ 1.4k
Tags: llm inference deepseek qwen speed-of-light
最后活动时间: 2026-06-12

mlops-python-package

一个全面的MLOps Python项目模板，帮助快速启动和标准化机器学习运维流程与数据管道。

Stars: ⭐️ 1.4k
Tags: MLOps Python MLflow Template
最后活动时间: 2026-01-25

PaddleSharp

百度Paddle推理库和PaddleOCR的.NET/C#绑定，支持跨平台AI推理。

Stars: ⭐️ 1.4k
Tags: paddlepaddle ocr dotnet inference
最后活动时间: 2026-05-26

mcp-server-kubernetes

MCP服务器，让AI助手能够管理和操作Kubernetes集群，实现智能化的容器编排与运维。

Stars: ⭐️ 1.4k
Tags: Kubernetes MCP DevOps
最后活动时间: 2026-06-11

ollama-docker

简化Ollama部署的Docker Compose配置，轻松在容器化环境中运行大语言模型。

Stars: ⭐️ 1.4k
Tags: ollama docker llm local-ai
最后活动时间: 2026-05-26

OmDet

实时准确的开放词汇端到端目标检测模型，支持零样本检测与视觉语言理解。

Stars: ⭐️ 1.4k
Tags: object-detection open-vocabulary zero-shot vision-language
最后活动时间: 2026-03-12

kitops

CNCF开源DevOps工具，用于打包和版本管理AI/ML模型、数据集和代码。支持OCI标准，便于Kubernetes部署。

Stars: ⭐️ 1.4k
Tags: mlops model-serving kubernetes devops
最后活动时间: 2026-06-11

xllm

高性能LLM推理引擎，针对多种AI加速器优化，支持DeepSeek、GLM、Qwen等主流大模型的高效部署。

Stars: ⭐️ 1.3k
Tags: Inference LLM Accelerator
最后活动时间: 2026-06-12

vllm-mlx

专为 Apple Silicon 优化的推理服务器，支持 LLM 和多模态模型的连续批处理推理，原生 MLX 后端实现高达 400+ tok/s 性能。

Stars: ⭐️ 1.3k
Tags: Apple Silicon MLX 推理服务 多模态
最后活动时间: 2026-06-12

AQLM

大语言模型极限压缩的官方PyTorch实现，支持加性量化压缩技术。

Stars: ⭐️ 1.3k
Tags: llm compression quantization pytorch
最后活动时间: 2026-02-26

parallax

分布式模型服务框架，支持在任何环境构建AI推理集群。

Stars: ⭐️ 1.3k
Tags: distributed-inference llm-serving model-serving
最后活动时间: 2026-06-05

llmgateway

统一管理多个LLM提供商API请求的网关，提供智能路由、速率限制、成本分析和安全防护功能。

Stars: ⭐️ 1.3k
Tags: API网关 多提供商 企业级
最后活动时间: 2026-06-12

keras-core

Keras API的多后端实现，支持TensorFlow、JAX和PyTorch三大框架，提供统一的深度学习开发体验。

Stars: ⭐️ 1.3k
Tags: keras deep-learning tensorflow pytorch jax
最后活动时间: 2026-03-10

guidellm

LLM部署评估工具，帮助优化大模型在实际推理场景中的性能表现。

Stars: ⭐️ 1.2k
Tags: LLM Evaluation Deployment Inference
最后活动时间: 2026-06-12

gemini-business2api

将 Gemini Business 转换为 OpenAI 兼容接口，支持多账户负载均衡及图像、视频生成等多模态能力。

Stars: ⭐️ 1.2k
Tags: gemini openai api-proxy load-balancing multimodal
最后活动时间: 2026-04-24

mlops-zero-to-hero

从零到精通的MLOps课程笔记，涵盖机器学习运维全流程实践。

Stars: ⭐️ 1.2k
Tags: mlops machine-learning devops udemy
最后活动时间: 2026-01-18

uni-api

统一管理多个LLM API提供商的网关服务，支持OpenAI、Claude、Gemini等后端，提供统一接口和负载均衡。

Stars: ⭐️ 1.2k
Tags: API网关 负载均衡 OpenAI兼容
最后活动时间: 2026-06-12

tabbyAPI

Exllama官方API服务器，兼容OpenAI接口格式，轻量高效，适合本地LLM推理部署。

Stars: ⭐️ 1.2k
Tags: llm-serving openai-compatible exllama api-server
最后活动时间: 2026-05-26

rtp-llm

阿里巴巴开源的高性能大语言模型推理引擎，专为多样化应用场景优化，提供卓越的推理性能。

Stars: ⭐️ 1.2k
Tags: LLM 推理引擎 阿里巴巴
最后活动时间: 2026-06-12

dlpack

通用内存张量结构标准，实现深度学习框架间零拷贝数据交换。

Stars: ⭐️ 1.2k
Tags: tensor deep-learning interoperability memory
最后活动时间: 2026-05-03

MInference

NeurIPS'24 Spotlight，通过动态稀疏注意力计算将长上下文LLM推理延迟降低10倍。

Stars: ⭐️ 1.2k
Tags: inference-optimization long-context sparse-attention llm
最后活动时间: 2026-04-08

pruna

模型优化框架，帮助开发者构建更快、更高效的AI模型，支持视觉、语言和语音模型。

Stars: ⭐️ 1.2k
Tags: model-optimization deep-learning llm computer-vision speech
最后活动时间: 2026-06-09

ClawVault

AI安全控制平台，提供原子级访问控制，确保AI操作全程可视可控。

Stars: ⭐️ 1.2k
Tags: ai-security access-control openclaw
最后活动时间: 2026-05-29

kubetorch

在Kubernetes上分布式运行AI工作负载的Python工具，像PyTorch一样简单管理ML基础设施。支持训练、推理和数据处理的无缝部署。

Stars: ⭐️ 1.2k
Tags: Kubernetes PyTorch Distributed AI ML Infrastructure
最后活动时间: 2026-05-29

kubeai

Kubernetes AI 推理运算符，支持 VLM、LLM、Embedding 和语音识别模型的生产级部署。

Stars: ⭐️ 1.2k
Tags: Kubernetes Inference LLM
最后活动时间: 2026-06-10

ezkl

一个用于深度学习模型和计算图的零知识证明推理引擎(ZKML)，支持Python、JavaScript和命令行调用。

Stars: ⭐️ 1.2k
Tags: ai cryptography zero-knowledge zkml
最后活动时间: 2026-02-20

clewdr

高性能LLM反向代理服务，支持多模型负载均衡。

Stars: ⭐️ 1.2k
Tags: llm proxy high-performance infrastructure
最后活动时间: 2026-06-08

cache-dit

PyTorch原生DiT推理引擎，支持混合缓存加速和大规模并行。专为扩散Transformer优化。

Stars: ⭐️ 1.2k
Tags: diffusion-transformer inference-engine cache optimization
最后活动时间: 2026-05-28

GPTQModel

LLM模型量化工具包，支持NVIDIA/AMD/Intel多硬件加速，集成vLLM和SGLang推理框架。

Stars: ⭐️ 1.2k
Tags: quantization llm vllm inference
最后活动时间: 2026-06-12

index-tts-vllm

为IndexTTS添加vLLM支持，实现更快速的TTS推理。

Stars: ⭐️ 1.2k
Tags: vllm tts inference-optimization text-to-speech
最后活动时间: 2026-04-13

truss

最简单的AI/ML模型生产部署工具。支持Stable Diffusion、Whisper等多种模型，一键打包部署到云端。

Stars: ⭐️ 1.2k
Tags: model-serving inference-server machine-learning
最后活动时间: 2026-06-11

onnxmltools

将机器学习模型转换为ONNX格式的工具集，支持Keras、scikit-learn等框架。

Stars: ⭐️ 1.2k
Tags: onnx model-conversion interoperability machine-learning
最后活动时间: 2026-05-01

mesh-llm

基于llama.cpp的分布式LLM推理框架，支持跨机器协同推理，提供完整的端到端演示。

Stars: ⭐️ 1.1k
Tags: llm distributed-inference llama.cpp
最后活动时间: 2026-06-12

vllm-studio

LLM推理服务控制面板，支持VLLM、Sglang、llama.cpp、exllamav3等多种推理引擎的统一管理与监控。

Stars: ⭐️ 1.1k
Tags: vllm llamacpp sglang local-ai model-serving
最后活动时间: 2026-06-12

search-and-learn

扩展开源模型推理时计算的资源配方。优化LLM推理性能与资源利用。

Stars: ⭐️ 1.1k
Tags: llm inference compute-optimization
最后活动时间: 2026-05-26

openfhe-development

开源全同态加密库，支持隐私保护计算和安全多方计算，适用于AI隐私保护场景。

Stars: ⭐️ 1.1k
Tags: cryptography homomorphic-encryption privacy fhe
最后活动时间: 2026-05-28

frugally-deep

轻量级仅头文件C++库，用于在C++中推理Keras/TensorFlow模型，适合边缘部署。

Stars: ⭐️ 1.1k
Tags: keras tensorflow cpp model-inference edge-computing
最后活动时间: 2026-05-06

ai-hub-models

高通AI Hub提供的SOTA机器学习模型集合，针对高通设备优化延迟和内存，可直接部署。

Stars: ⭐️ 1.1k
Tags: deeplearning inference onnx pytorch tensorflow-lite
最后活动时间: 2026-06-12

wllama

llama.cpp的WebAssembly绑定，实现浏览器端LLM推理能力。

Stars: ⭐️ 1.1k
Tags: wasm webassembly llm browser-inference
最后活动时间: 2026-06-01

kvpress

简化LLM KV缓存压缩，支持长上下文推理优化。

Stars: ⭐️ 1.1k
Tags: kv-cache compression llm long-context
最后活动时间: 2026-06-10

awesome-mojo

Mojo编程语言的精选资源列表，Mojo是专为AI开发设计的高性能编程语言，兼容Python生态。

Stars: ⭐️ 1.1k
Tags: mojo ai programming-language python-compatible
最后活动时间: 2026-05-08

MCPJungle

自托管的MCP网关，为AI代理提供统一的MCP服务器管理和注册服务。

Stars: ⭐️ 1.1k
Tags: MCP 网关 基础设施
最后活动时间: 2026-05-20

fizz-gateway-node

大模型API聚合网关，支持API集成、脱敏、安全与溯源，为企业级AI应用提供统一的模型调用管理。

Stars: ⭐️ 1.1k
Tags: api-gateway llm ai-gateway security
最后活动时间: 2025-12-17

csghub-server

CSGHub后端服务，支持数据集和模型管理、模型推理、微调及应用空间运行。

Stars: ⭐️ 1.1k
Tags: 模型管理 推理服务 平台
最后活动时间: 2026-05-29

nixl

NVIDIA推理传输库，优化AI模型推理过程中的数据传输性能。

Stars: ⭐️ 1.1k
Tags: nvidia inference gpu-optimization transfer-library
最后活动时间: 2026-05-28

mongodb-mcp-server

MCP 协议服务器，让 AI Agent 能够连接和操作 MongoDB 数据库及 Atlas 集群。

Stars: ⭐️ 1.0k
Tags: mcp mcp-server mongodb mongodb-atlas
最后活动时间: 2026-06-11

VoAPI

新一代AI大模型API聚合分发系统，支持多模型统一接口管理，具备高扩展性和高性能。

Stars: ⭐️ 1.0k
Tags: api-gateway openai claude ai-agents api-aggregation
最后活动时间: 2026-01-27

optimum-quanto

PyTorch 模型量化后端，支持高效模型部署和推理优化。

Stars: ⭐️ 1.0k
Tags: quantization pytorch model-optimization inference
最后活动时间: 2026-06-09

Fast-dLLM

无需训练即可加速扩散LLM推理的方法，支持KV缓存与并行解码。

Stars: ⭐️ 1.0k
Tags: llm inference acceleration kv-cache
最后活动时间: 2026-05-30

monarch

PyTorch单控制器架构，用于分布式训练和模型并行计算。

Stars: ⭐️ 1.0k
Tags: pytorch distributed model-parallelism
最后活动时间: 2026-05-27

onnxruntime-genai

ONNX Runtime 的生成式 AI 扩展，提供高效的模型推理与部署能力。

Stars: ⭐️ 1.0k
Tags: onnx generative-ai model-inference optimization
最后活动时间: 2026-05-26

TorchBench

PyTorch官方性能评估基准测试集合，用于评估和优化PyTorch模型性能。

Stars: ⭐️ 1.0k
Tags: pytorch benchmark performance
最后活动时间: 2026-06-12

TileRT

基于分块计算的 LLM 推理运行时，实现超低延迟的大语言模型推理服务。

Stars: ⭐️ 1.0k
Tags: llm-inference low-latency runtime optimization
最后活动时间: 2026-05-22

YOLOs-CPP

跨平台生产级C++推理引擎，支持YOLO v5-v12模型，统一API实现目标检测、分割、姿态估计等功能，基于ONNX Runtime优化。

Stars: ⭐️ 1.0k
Tags: yolo inference-engine onnx cpp object-detection
最后活动时间: 2026-04-13

TenSEAL

用于张量同态加密操作的Python库，支持隐私保护机器学习。基于Microsoft SEAL构建，实现加密状态下的深度学习计算。

Stars: ⭐️ 1.0k
Tags: Homomorphic Encryption Privacy-Preserving ML Tensor Operations
最后活动时间: 2026-02-27

openinference

专为AI应用设计的OpenTelemetry可观测性工具，支持LangChain、LlamaIndex等主流框架的追踪与监控。

Stars: ⭐️ 1.0k
Tags: Observability OpenTelemetry LLMOps
最后活动时间: 2026-06-11

litert-torch

支持PyTorch模型转换为LiteRT格式的工具，用于端侧部署优化。

Stars: ⭐️ 1.0k
Tags: pytorch model-conversion on-device tensorflow-lite
最后活动时间: 2026-05-08

chronon

专为AI/ML应用设计的数据服务平台，提供高效的数据管道和特征存储能力。

Stars: ⭐️ 1.0k
Tags: ml data-platform feature-store ai-infrastructure
最后活动时间: 2026-06-12

ThinkWatch

企业级 AI 堡垒机，提供安全的 AI API 和 MCP 访问代理，支持 RBAC、审计日志、限流和成本追踪。

Stars: ⭐️ 995
Tags: ai-gateway mcp-security ai-security mcp-gateway
最后活动时间: 2026-05-27

ccflare

Claude Code的高性能代理服务，提供API转发与流量管理功能。

Stars: ⭐️ 992
Tags: claude-api proxy anthropic-api claude-code
最后活动时间: 2026-04-19

relay-pulse

企业级 LLM 中转服务可用性监控系统，实时追踪服务状态并提供可视化仪表板，保障 AI 服务稳定性。

Stars: ⭐️ 989
Tags: LLM监控 服务可用性 可视化
最后活动时间: 2026-05-27

bedrock-access-gateway

为Amazon Bedrock提供OpenAI兼容的RESTful API接口，便于开发者无缝迁移和集成AWS大模型服务。

Stars: ⭐️ 987
Tags: AWS Bedrock OpenAI Compatible API Gateway
最后活动时间: 2026-06-04

nobodywho

支持多平台的本地LLM推理引擎，可在任何设备上高效运行大语言模型，支持Godot游戏引擎和Flutter。

Stars: ⭐️ 980
Tags: Inference Local AI Cross-platform
最后活动时间: 2026-06-11

compose-for-agents

使用 Docker Compose 构建和运行 AI 智能体，提供开箱即用的编排示例。

Stars: ⭐️ 975
Tags: ai-agents docker docker-compose llm self-hosted
最后活动时间: 2026-06-04

JSTprove

快速、可验证的AI推理框架，基于零知识机器学习(zkML)技术，为AI模型提供可验证的计算证明。

Stars: ⭐️ 970
Tags: zkml verifiable-ai zero-knowledge
最后活动时间: 2026-04-23

onnx2tf

强大的模型转换工具，支持 ONNX 到 TFLite、TensorFlow、PyTorch 等多种格式的相互转换，支持 Core ML 导出。

Stars: ⭐️ 967
Tags: onnx tensorflow pytorch model-converter coreml
最后活动时间: 2026-06-04

ccNexus

专为Claude Code和Codex CLI设计的智能API网关，支持端点轮换、用量监控，并可无缝集成OpenAI、Gemini等多个AI平台。

Stars: ⭐️ 961
Tags: API Gateway Claude Code Load Balancing
最后活动时间: 2026-06-01

Nanoflow

面向吞吐量的高性能LLM服务框架。针对CUDA优化，专为大规模语言模型推理设计。

Stars: ⭐️ 961
Tags: llm-serving inference cuda high-performance
最后活动时间: 2026-03-29

NyaProxy

统一的AI服务API管理网关，支持OpenAI、Gemini、Anthropic等主流AI平台，提供负载均衡、速率限制和安全访问能力。

Stars: ⭐️ 960
Tags: API Proxy Load Balancer Multi-LLM
最后活动时间: 2026-05-22

opencv_zoo

OpenCV官方模型库，提供预训练模型和性能基准测试，支持DNN推理。

Stars: ⭐️ 957
Tags: model-zoo opencv deep-learning benchmark
最后活动时间: 2026-05-28

zzz-api

稳定的OpenAI、Claude等API代理服务，支持多种AI模型接口调用。

Stars: ⭐️ 957
Tags: api-proxy openai claude gemini
最后活动时间: 2026-02-02

checkpoint-engine

用于LLM推理引擎的轻量级中间件，支持动态更新模型权重。

Stars: ⭐️ 956
Tags: llm-inference checkpoint model-serving middleware
最后活动时间: 2026-02-28

YOLOs-CPP

跨平台生产级C++推理引擎，支持YOLO v5-v12模型，统一API实现目标检测、分割、姿态估计等功能，基于ONNX Runtime优化。

Stars: ⭐️ 952
Tags: yolo inference-engine onnx cpp object-detection
最后活动时间: 2026-04-13

AI-Gateway

基于Azure API Management和Microsoft Foundry的AI网关实验室，支持探索AI模型、MCP服务器和智能体开发。

Stars: ⭐️ 943
Tags: AI Gateway MCP Agents Azure
最后活动时间: 2026-06-10

sherpa

基于下一代Kaldi的语音识别服务器框架，支持多种端到端ASR模型，提供WebSocket实时接口。

Stars: ⭐️ 938
Tags: ASR 实时语音 模型部署
最后活动时间: 2026-06-12

NVFlare

NVIDIA开发的联邦学习应用运行环境，支持去中心化的隐私保护机器学习训练和推理。

Stars: ⭐️ 937
Tags: federated-learning privacy distributed-ml
最后活动时间: 2026-05-28

transcriptionstream

开箱即用的自托管离线转录服务，支持说话人分离和LLM摘要生成。完全本地化运行，保护隐私数据安全。

Stars: ⭐️ 936
Tags: 转录服务 说话人分离 自托管
最后活动时间: 2026-01-18

tensorrtllm_backend

NVIDIA Triton推理服务器的TensorRT-LLM后端，提供高性能LLM推理部署能力。

Stars: ⭐️ 935
Tags: tensorrt triton llm-inference nvidia
最后活动时间: 2026-06-10

openpcc

可验证隐私AI推理的开源框架。保护数据隐私的同时执行模型推理。

Stars: ⭐️ 934
Tags: privacy inference secure-computation
最后活动时间: 2026-01-08

GoModel

轻量级AI网关，提供统一的OpenAI兼容API，支持OpenAI、Anthropic、Gemini、Groq、xAI和Ollama等多家LLM提供商。

Stars: ⭐️ 933
Tags: ai-gateway llm openai-compatible golang
最后活动时间: 2026-06-11

hpc-ops

高性能LLM推理算子库，优化大模型推理性能。

Stars: ⭐️ 927
Tags: llm inference high-performance
最后活动时间: 2026-06-11

Paddle2ONNX

飞桨模型转换为ONNX格式的工具，支持分类、检测、OCR等多种模型导出。

Stars: ⭐️ 922
Tags: onnx paddlepaddle model-conversion deployment
最后活动时间: 2026-03-18

ssd

轻量级推理引擎，支持推测解码(SSD)技术，加速大模型推理过程。

Stars: ⭐️ 921
Tags: inference-engine speculative-decoding llm
最后活动时间: 2026-05-10

mindnlp

MindSpore与HuggingFace无缝集成库，支持在昇腾平台上运行Transformers和Diffusers模型。

Stars: ⭐️ 919
Tags: mindspore huggingface transformers llm deep-learning
最后活动时间: 2026-03-08

Serving

飞桨服务化部署框架，支持高性能模型推理服务部署，提供DAG流水线和微服务架构。

Stars: ⭐️ 919
Tags: model-serving deep-learning deployment paddle
最后活动时间: 2026-02-20

wassette

安全导向的WebAssembly组件运行时，通过MCP协议支持AI模型部署。

Stars: ⭐️ 916
Tags: mcp wasm wasm-component wasmtime
最后活动时间: 2026-06-03

oryx

基于Apache Spark和Kafka的Lambda架构框架，支持大规模实时机器学习应用。

Stars: ⭐️ 915
Tags: apache-spark apache-kafka machine-learning lambda-architecture
最后活动时间: 2026-03-27

fal

快速部署开源机器学习模型的高性能推理平台，支持大规模生产环境服务。

Stars: ⭐️ 913
Tags: model-serving ml-inference production-ml
最后活动时间: 2026-05-27

xmanager

机器学习实验管理平台，支持大规模实验组织和追踪。

Stars: ⭐️ 912
Tags: experiment-management machine-learning deepmind
最后活动时间: 2026-06-11

ZhiLight

高性能LLM推理加速引擎，针对Llama及其变体模型进行深度优化。

Stars: ⭐️ 905
Tags: Inference CUDA LLM Serving
最后活动时间: 2026-03-18

Kiro-Go

将Kiro账户转换为OpenAI/Anthropic兼容API的工具，支持多账户池化、流式传输和Web管理面板。

Stars: ⭐️ 904
Tags: api-proxy openai-api anthropic model-serving
最后活动时间: 2026-05-31

mosec

高性能ML模型服务框架，支持动态批处理和CPU/GPU流水线。用Rust编写核心，充分利用计算资源。

Stars: ⭐️ 901
Tags: model-serving inference gpu rust
最后活动时间: 2026-06-10

mistral-common

Mistral模型官方推理预处理库。提供标准化的模型输入处理流程。

Stars: ⭐️ 896
Tags: mistral llm inference preprocessing
最后活动时间: 2026-05-28

chatllm.cpp

纯C++实现的本地LLM推理框架，支持CPU和GPU实时聊天推理，轻量高效。

Stars: ⭐️ 895
Tags: LLM Inference C++ Local
最后活动时间: 2026-06-10

model_server

专为OpenVINO优化的可扩展推理服务器。支持边缘和云端部署，提供DAG流水线能力。

Stars: ⭐️ 889
Tags: openvino inference edge-ai kubernetes
最后活动时间: 2026-06-12

MLServer

多功能机器学习推理服务器，支持Scikit-learn、XGBoost、LightGBM等多种框架的多模型部署。

Stars: ⭐️ 888
Tags: model-serving inference mlflow scikit-learn xgboost
最后活动时间: 2026-05-28

vllm-studio

VLLM、Sglang、llama.cpp等LLM推理引擎的可视化控制面板，简化本地AI模型部署与管理。

Stars: ⭐️ 884
Tags: vllm llm inference local-ai dashboard
最后活动时间: 2026-05-08

hyper-mcp

快速安全的MCP服务器，支持WebAssembly插件扩展，为AI应用提供灵活架构。

Stars: ⭐️ 880
Tags: MCP WebAssembly 插件化
最后活动时间: 2026-06-11

dmlc-core

分布式机器学习核心组件库，为XGBoost等框架提供可扩展的基础设施支持。

Stars: ⭐️ 877
Tags: distributed-ml xgboost scalable
最后活动时间: 2026-05-25

restheart

面向AI代理的MongoDB后端服务，支持MCP协议，为智能体提供数据持久化解决方案。

Stars: ⭐️ 877
Tags: ai-agents mcp-server mongodb database
最后活动时间: 2026-06-09

Bonsai-demo

小型语言模型本地运行演示项目，支持llamacpp和MLX后端，适合在本地设备上体验轻量级LLM。

Stars: ⭐️ 858
Tags: llm llamacpp mlx small-models local-inference
最后活动时间: 2026-05-31

mesh-llm

基于llama.cpp的分布式LLM推理参考实现，支持跨机器分布式推理，提供端到端演示。

Stars: ⭐️ 846
Tags: llm distributed-inference llama.cpp
最后活动时间: 2026-04-23

coderunner

为AI代理设计的本地沙箱环境，支持安全隔离的代码执行和容器化运行，保障AI代码执行的安全性。

Stars: ⭐️ 844
Tags: Sandbox Claude Code MCP Containerization
最后活动时间: 2026-05-16

Yatai

Kubernetes上的大规模模型部署平台。与BentoML深度集成，简化容器化模型服务管理。

Stars: ⭐️ 843
Tags: model-deployment kubernetes bentoml mlops
最后活动时间: 2026-05-30

comfy-cli

ComfyUI官方命令行管理工具，简化Stable Diffusion工作流的安装、更新与环境配置。

Stars: ⭐️ 841
Tags: ComfyUI CLI Stable Diffusion
最后活动时间: 2026-06-12

onprem

离线环境LLM应用工具包，专为处理敏感数据和受限环境设计，支持本地化部署。

Stars: ⭐️ 840
Tags: llm offline privacy local-deployment
最后活动时间: 2026-06-11

yokai

模块化、可观测的Go后端框架，内置MCP服务器支持，便于构建AI集成应用。

Stars: ⭐️ 835
Tags: go mcp mcp-server framework observability
最后活动时间: 2026-05-22

llamafarm

一站式AI模型部署平台，支持本地或远程快速部署模型、Agent、RAG和数据库管道。

Stars: ⭐️ 829
Tags: 模型部署 MLOps RAG
最后活动时间: 2026-06-10

Stan Math Library

C++模板库，支持任意阶自动微分（前向、反向和混合模式），内置概率建模、线性代数和方程求解函数。

Stars: ⭐️ 825
Tags: Automatic Differentiation C++ Probabilistic Modeling
最后活动时间: 2026-05-28

darknet

经典开源深度学习框架，YOLO目标检测算法的原始实现，广泛用于实时目标检测应用。

Stars: ⭐️ 811
Tags: yolo object-detection neural-networks computer-vision
最后活动时间: 2026-05-20

llama3.java

纯Java实现的Llama 3推理引擎，支持SIMD加速，适合Java生态的LLM部署。

Stars: ⭐️ 810
Tags: llm java llama3 inference
最后活动时间: 2026-04-24

OmniInfer

跨设备的高效隐私LLM和VLM推理引擎，支持本地化部署。

Stars: ⭐️ 806
Tags: llm-inference vlm local-ai privacy
最后活动时间: 2026-05-26

QPT

一款专注于AI/深度学习项目的Python打包工具，可将Python项目转换为可执行EXE文件，支持CUDA、PaddlePaddle等深度学习框架的无缝打包部署。

Stars: ⭐️ 795
Tags: python packaging deep-learning cuda paddlepaddle
最后活动时间: 2026-02-06

MagiAttention

面向超长上下文和异构数据训练的分布式注意力机制，实现线性可扩展性。

Stars: ⭐️ 789
Tags: distributed-attention long-context training scalability
最后活动时间: 2026-04-21

llm-server-docs

完整的本地私有LLM服务器部署文档，支持聊天、RAG、MCP、图像生成和TTS等功能。

Stars: ⭐️ 787
Tags: LLM Server Self-hosted Docker
最后活动时间: 2026-03-02

reverb

高效易用的机器学习数据存储和传输系统，专为ML研究设计。

Stars: ⭐️ 780
Tags: data-storage reinforcement-learning tensorflow
最后活动时间: 2026-05-21

clove

Claude.ai 反向代理服务，帮助开发者更灵活地调用 Claude API 服务。

Stars: ⭐️ 756
Tags: claude reverse-proxy api
最后活动时间: 2026-03-28

stable-diffusion-portable

便携版Stable Diffusion部署方案，无需安装即可快速运行AI图像生成。

Stars: ⭐️ 751
Tags: stable-diffusion portable image-generation
最后活动时间: 2026-02-24

rvllm

高性能 Rust 实现的 LLM 推理引擎，可作为 vLLM 的直接替代方案。

Stars: ⭐️ 738
Tags: llm inference rust vllm serving
最后活动时间: 2026-06-11

io

TensorFlow SIG-IO维护的数据集、流媒体和文件系统扩展库。

Stars: ⭐️ 737
Tags: tensorflow dataset streaming filesystem
最后活动时间: 2026-05-20

catwalk

LLM推理提供商和模型的集合工具，支持多种推理后端和模型格式，便于快速切换和部署。

Stars: ⭐️ 733
Tags: LLM Inference Model Serving
最后活动时间: 2026-06-12

yolort

YOLOv5跨平台推理运行时，支持TensorRT、ONNXRuntime、TVM等多种加速器部署。

Stars: ⭐️ 730
Tags: yolo inference tensorrt onnxruntime pytorch
最后活动时间: 2026-04-10

lws

Kubernetes API用于部署LLM推理工作负载，支持Leader-Worker模式的Pod组复制管理。

Stars: ⭐️ 729
Tags: llm-inference kubernetes model-serving
最后活动时间: 2026-05-26

aperture

现代化工作负载的限流、缓存和请求优先级管理工具，支持LLM和云原生环境。

Stars: ⭐️ 728
Tags: rate-limiter caching kubernetes llm cloud-native
最后活动时间: 2025-12-21

MCP

Jina AI官方远程MCP服务器，为AI应用提供模型上下文协议支持。

Stars: ⭐️ 726
Tags: mcp mcp-server jina-ai
最后活动时间: 2026-06-02

mlx-omni-server

基于Apple MLX框架的本地推理服务器，提供OpenAI兼容API，专为Apple Silicon优化。

Stars: ⭐️ 724
Tags: mlx local-inference openai-api apple-silicon
最后活动时间: 2026-05-09

mcpcan

MCP服务集中管理平台，支持容器化部署、服务监控和令牌验证，解决MCP服务安全与快速部署问题。

Stars: ⭐️ 723
Tags: MCP Container Kubernetes Platform
最后活动时间: 2026-04-03

LightCompress

强大的大模型压缩工具包，支持LLM、VLM和视频生成模型的量化、剪枝和Token缩减。已被EMNLP 2024和AAAI 2026收录。

Stars: ⭐️ 722
Tags: Model Compression Quantization LLM Pruning
最后活动时间: 2026-05-14

mlops-coding-course

MLOps实战课程，教授如何构建、开发与维护企业级机器学习运维代码库。

Stars: ⭐️ 710
Tags: mlops machine-learning devops best-practices
最后活动时间: 2026-04-27

mcp-proxy

MCP代理服务器，通过单一HTTP端点聚合和提供多个MCP资源服务。

Stars: ⭐️ 697
Tags: mcp mcp-server claude modelcontextprotocol
最后活动时间: 2026-02-19

triton-client

NVIDIA Triton推理服务器客户端库，支持Python、C++、Java等多语言模型部署与调用。

Stars: ⭐️ 691
Tags: triton inference-server model-serving grpc
最后活动时间: 2026-05-21

FfDL

IBM开源的深度学习平台，在Kubernetes上提供TensorFlow、PyTorch、Caffe等框架即服务，支持模型训练与部署。

Stars: ⭐️ 690
Tags: Deep Learning Kubernetes Model Serving
最后活动时间: 2026-01-29

kale

Kubeflow流水线的数据科学工具包，简化机器学习工作流的部署与管理。

Stars: ⭐️ 689
Tags: kubeflow kubeflow-pipelines machine-learning
最后活动时间: 2026-05-28

mcp-gateway

MCP服务器的反向代理和管理层，支持Kubernetes环境下的可扩展、会话感知的状态路由和生命周期管理。

Stars: ⭐️ 687
Tags: MCP LLM Infrastructure Kubernetes
最后活动时间: 2026-06-10

ServerlessLLM

面向所有人的无服务器LLM服务框架。支持HuggingFace模型，降低大模型部署门槛。

Stars: ⭐️ 684
Tags: serverless llm-serving huggingface model-serving
最后活动时间: 2026-05-04

timber

经典ML模型的AOT编译器，将XGBoost、LightGBM等模型编译为C99推理代码，比Python快336倍。

Stars: ⭐️ 683
Tags: Model Serving Compiler Inference
最后活动时间: 2026-04-16

OrcaRouter-Lite

自托管的LLM路由器，内置安全防护网。支持OpenAI兼容接口、BYOK和流式传输，适合需要自主控制AI调用的场景。

Stars: ⭐️ 683
Tags: llm-router self-hosted openai-compatible ai-gateway
最后活动时间: 2026-05-28

ml-metadata

ML工作流元数据记录与检索工具，帮助管理机器学习开发流程。

Stars: ⭐️ 678
Tags: ml-metadata ml-pipeline workflow
最后活动时间: 2026-02-12

px-kvstore

专为AI应用设计的键值存储解决方案，支持大规模模型推理和数据缓存场景。

Stars: ⭐️ 678
Tags: key-value-store ai-infrastructure data-storage high-performance
最后活动时间: 2026-05-07

gateway-api-inference-extension

Kubernetes Gateway API的推理扩展，为AI模型推理提供标准化的流量管理和路由能力。

Stars: ⭐️ 677
Tags: Kubernetes Inference API Gateway
最后活动时间: 2026-05-19

candle-vllm

高效的本地LLM推理和服务平台，提供OpenAI兼容的API服务器。

Stars: ⭐️ 675
Tags: inference llm api-server
最后活动时间: 2026-06-11

MinivLLM

轻量级vLLM复现实现，包含自包含的分页注意力和Flash Attention核心组件。

Stars: ⭐️ 674
Tags: vllm inference paged-attention flash-attention
最后活动时间: 2026-03-16

UncommonRoute

智能LLM路由代理，实现82%成本节省，可作为OpenAI的即插即用替代方案。

Stars: ⭐️ 672
Tags: llm model-routing cost-optimization openai router
最后活动时间: 2026-05-12

long-context-attention

统一序列并行注意力机制USP，支持长上下文Transformer模型的训练与推理。

Stars: ⭐️ 670
Tags: ring-attention sequence-parallel llm-training llm-inference
最后活动时间: 2026-05-21

SwiftLM

专为Apple Silicon设计的原生MLX Swift LLM推理服务器，支持OpenAI兼容API和100B+ MoE模型。

Stars: ⭐️ 669
Tags: mlx swift llm-inference apple-silicon openai-api on-device-ai
最后活动时间: 2026-05-19

Gemini-FastAPI

将 Gemini 模型封装为 OpenAI 兼容的 API 接口，方便开发者无缝切换使用。

Stars: ⭐️ 667
Tags: fastapi gemini openai-api api-wrapper
最后活动时间: 2026-04-13

ITensors.jl

Julia语言的高效张量计算与张量网络库，广泛应用于机器学习、量子计算和物理模拟领域。

Stars: ⭐️ 664
Tags: tensor-computations tensor-networks julia machine-learning
最后活动时间: 2026-04-18

kronk

Go语言本地开源模型推理引擎，集成llama.cpp，提供OpenAI兼容的高层API。

Stars: ⭐️ 664
Tags: llm-inference go llama-cpp local-ai openai-compatible
最后活动时间: 2026-06-11

OpenTinker

RL-as-a-Service基础设施平台，专为基础模型提供强化学习服务能力。

Stars: ⭐️ 662
Tags: RL Infrastructure Foundation Models
最后活动时间: 2026-03-21

zerogravity

兼容OpenAI、Anthropic和Gemini的代理服务，模拟真实Antigravity流量访问Google服务。

Stars: ⭐️ 661
Tags: OpenAI Anthropic Gemini Proxy
最后活动时间: 2026-04-16

ai-dial-core

AI DIAL核心组件，提供统一的API接口访问多种聊天模型、嵌入模型和AI助手。

Stars: ⭐️ 657
Tags: Model Gateway API Proxy LLM Serving
最后活动时间: 2026-05-28

stablehlo

向后兼容的ML计算算子集，受HLO/MHLO启发，用于跨框架模型移植。

Stars: ⭐️ 653
Tags: ml-compiler portable-ml hlo
最后活动时间: 2026-05-27

nest-simulator

脉冲神经网络模拟器，用于计算神经科学和类脑计算研究，支持大规模神经元网络仿真。

Stars: ⭐️ 649
Tags: neuroscience spiking-neural-networks simulation
最后活动时间: 2026-06-12

zerobox

轻量级跨平台进程沙箱工具，为AI智能体提供文件、网络和凭证控制的安全隔离环境。

Stars: ⭐️ 648
Tags: sandbox security llm-sandbox mcp process-isolation rust
最后活动时间: 2026-05-17

backend.ai

一个流线型的容器化计算集群平台，支持主流ML框架和多种编程语言，提供CUDA GPU、TPU、NPU等异构加速器支持。

Stars: ⭐️ 647
Tags: ML Infrastructure GPU Computing Container Platform
最后活动时间: 2026-06-12

ck

社区驱动的AI/ML自动化与基准测试平台，基于MLPerf方法论帮助优化AI工作负载在不同硬件和软件环境中的性能。

Stars: ⭐️ 647
Tags: mlperf mlops benchmarking automation ai-optimization
最后活动时间: 2026-06-05

vmlx

MLX 模型压缩与缓存系统，支持 L2 磁盘缓存、L1 分页和连续批处理优化。

Stars: ⭐️ 644
Tags: mlx llm kvcache-optimization mcp-server openai-api
最后活动时间: 2026-06-12

lollms_hub

多实例Ollama代理服务器，提供API网关、负载均衡、速率限制和密钥安全管理功能。

Stars: ⭐️ 636
Tags: ollama api-gateway load-balancer proxy llm-serving
最后活动时间: 2026-04-23

icechunk

云原生事务性张量存储引擎，专为AI/ML工作负载设计，支持xarray和Zarr格式的高效数据管理。

Stars: ⭐️ 626
Tags: tensor-storage xarray zarr cloud-native
最后活动时间: 2026-05-28

Qwen2API

将 QwenLM 大语言模型转换为 API 服务的工具，让模型能力更易集成和调用。

Stars: ⭐️ 624
Tags: qwen llm api model-serving
最后活动时间: 2026-05-26

ollama_proxy_server

Ollama多实例代理服务器，提供API密钥安全管理、智能负载均衡和用户权限管理，适合团队协作部署。

Stars: ⭐️ 623
Tags: Ollama Proxy Load Balancer
最后活动时间: 2026-04-23

SINQ

新型快速高质量量化方法，可在保持精度的同时压缩大语言模型。

Stars: ⭐️ 621
Tags: quantization llm-compression model-optimization
最后活动时间: 2026-05-08

ai00_server

一体化 RWKV 运行时服务，集成嵌入、RAG、AI 智能体等功能，兼容 OpenAI API。

Stars: ⭐️ 615
Tags: rwkv llm rag openai-api aiagents
最后活动时间: 2026-06-09

Neuraxle

简洁的AutoML库，提供清晰的深度学习生产管道抽象。支持超参数调优，兼容Scikit-Learn和TensorFlow。

Stars: ⭐️ 614
Tags: automl pipeline hyperparameter-tuning machine-learning
最后活动时间: 2026-02-20

ejml

高性能Java线性代数库，支持密集矩阵、稀疏矩阵、实数和复数矩阵运算，是机器学习和AI开发的基础数学库。

Stars: ⭐️ 614
Tags: linear-algebra matrix machine-learning java
最后活动时间: 2026-05-27

llms

LLM客户端、服务器API和UI工具集，提供完整的模型服务解决方案。

Stars: ⭐️ 611
Tags: LLM API Server
最后活动时间: 2026-06-11

informers

Ruby语言的高性能Transformer推理库，支持命名实体识别、问答和情感分析任务。

Stars: ⭐️ 610
Tags: ruby transformer-inference nlp
最后活动时间: 2026-04-25

dlstreamer

Intel开源的深度学习流媒体分析框架，基于GStreamer构建云端和边缘媒体分析管道。

Stars: ⭐️ 607
Tags: deep-learning gstreamer inference openvino edge-ai
最后活动时间: 2026-05-29

hugot

Golang语言的ONNX Transformer推理管道，支持在Go环境中运行NLP模型。

Stars: ⭐️ 606
Tags: golang onnx transformer-inference
最后活动时间: 2026-05-24

fastapi-ml-skeleton

FastAPI机器学习模型服务骨架应用，快速构建生产级ML API服务。

Stars: ⭐️ 603
Tags: fastapi model-serving production-ml
最后活动时间: 2026-01-08

OpenTrit-CHN

开源跨框架混合三值化工具包，支持PyTorch与TensorFlow模型一键转换，封装异构算力调度与量化优化。

Stars: ⭐️ 600
Tags: quantization pytorch tensorflow model-compression
最后活动时间: 2026-03-01

yolobox

AI模型安全运行沙盒工具，让你的AI模型在隔离环境中运行，保护主目录安全。

Stars: ⭐️ 598
Tags: ai-sandbox yolo containerization
最后活动时间: 2026-05-20

openscoring

RESTful Web服务，用于Scikit-Learn、R和Apache Spark模型的实时推理评分（延迟<1ms），支持PMML格式模型部署。

Stars: ⭐️ 588
Tags: machine-learning model-serving pmml scikit-learn real-time-inference
最后活动时间: 2026-02-02

optimistix

基于JAX+Equinox的非线性优化库，支持根查找、最小二乘等优化任务。

Stars: ⭐️ 584
Tags: optimization jax deep-learning equinox
最后活动时间: 2026-05-13

model-runner

Docker官方推出的模型运行工具，支持在Docker容器中快速部署和运行AI大语言模型，简化本地AI开发流程。

Stars: ⭐️ 581
Tags: docker llm model-serving inference
最后活动时间: 2026-05-27

llama-cpp-rs

llama.cpp 的 Rust 语言绑定，提供高效的本地 LLM 推理能力。

Stars: ⭐️ 573
Tags: llm rust inference llama-cpp
最后活动时间: 2026-05-28

Awesome-DiT-Inference

Diffusion Transformer推理优化论文与代码合集，涵盖采样加速、量化、并行计算等核心技术。

Stars: ⭐️ 565
Tags: DiT 推理优化 量化 Diffusion
最后活动时间: 2026-03-19

casbin-gateway

专为AI和MCP服务设计的安全网关，支持HTTP代理和OAuth认证，为LLM应用提供企业级安全防护。

Stars: ⭐️ 560
Tags: AI Security LLM Gateway MCP Proxy
最后活动时间: 2026-06-09

llumnix-ray

高效易用的多实例 LLM 服务框架，支持大规模模型部署与推理调度优化。

Stars: ⭐️ 547
Tags: llm-serving inference ray multi-instance
最后活动时间: 2026-03-12

jpmml-sklearn

将Scikit-Learn机器学习流水线转换为PMML格式的Java库，便于模型部署与跨平台迁移。

Stars: ⭐️ 540
Tags: pmml scikit-learn model-deployment machine-learning
最后活动时间: 2026-04-28

lineax

基于JAX和Equinox的线性求解器库，为深度学习提供高效的线性代数运算支持。

Stars: ⭐️ 539
Tags: jax linear-algebra equinox solver
最后活动时间: 2026-04-20

crater

云原生 AI 训练与推理平台，支持 Kubernetes 部署，集成 PyTorch、TensorFlow、vLLM 等主流框架。

Stars: ⭐️ 534
Tags: kubernetes ai-training inference pytorch vllm ray
最后活动时间: 2026-06-11

traceml

Polyaxon的ML追踪与可视化引擎，支持数据漂移检测、模型可解释性分析和交互式仪表盘。

Stars: ⭐️ 532
Tags: MLOps Visualization Drift Detection
最后活动时间: 2026-06-10

TensorLayerX

跨平台统一深度学习框架，支持PyTorch、TensorFlow、MindSpore等多后端。

Stars: ⭐️ 527
Tags: deep-learning cross-platform pytorch tensorflow paddlepaddle
最后活动时间: 2026-01-23

aikit

开源大模型微调、构建和部署的一站式工具，支持Docker和Kubernetes环境下的LLM服务化。

Stars: ⭐️ 526
Tags: LLM Deployment Docker
最后活动时间: 2026-06-08

NadirClaw

开源LLM路由器和AI成本优化器，自动将简单提示路由到便宜/本地模型，复杂提示路由到高级模型。兼容OpenAI API，可节省40-70%的AI API成本。

Stars: ⭐️ 525
Tags: llm-router ai-cost-optimization openai-proxy model-routing self-hosted
最后活动时间: 2026-06-08

HolisticTraceAnalysis

用于分析PyTorch执行追踪的库，帮助开发者优化深度学习模型的性能瓶颈。

Stars: ⭐️ 519
Tags: pytorch profiling tracing performance deep-learning
最后活动时间: 2026-05-21

FlagScale

基于开源项目构建的大模型工具包，提供模型训练、推理和部署的完整解决方案。

Stars: ⭐️ 517
Tags: large-language-models llm-toolkit model-inference
最后活动时间: 2026-05-28

skops

HuggingFace出品的Python库，帮助分享和部署scikit-learn机器学习模型。

Stars: ⭐️ 514
Tags: MLOps scikit-learn Deployment
最后活动时间: 2026-06-08

MCPSpy

基于eBPF的MCP协议监控工具，用于AI安全与可观测性分析。

Stars: ⭐️ 514
Tags: mcp monitoring ebpf ai-security
最后活动时间: 2026-01-16

model_analyzer

Triton推理服务器模型分析工具，帮助理解模型的计算和内存需求。

Stars: ⭐️ 513
Tags: inference gpu performance-analysis deep-learning
最后活动时间: 2026-06-12

openvino.genai

基于OpenVINO运行时的生成式AI推理框架，提供简洁的C++/Python API，支持高效部署大语言模型。

Stars: ⭐️ 512
Tags: generative-ai openvino inference llm
最后活动时间: 2026-05-28

popmon

Pandas和Spark数据框稳定性监控工具，支持数据漂移检测和统计过程控制。

Stars: ⭐️ 511
Tags: Data Monitoring Drift Detection Spark
最后活动时间: 2026-01-09

FAST

高性能医学图像处理与神经网络推理可视化框架，支持GPU加速和流式处理。

Stars: ⭐️ 510
Tags: Medical Imaging Deep Learning Inference Visualization
最后活动时间: 2026-04-09

restai

开源AIaaS平台，支持多种公共和本地LLM，集成RAG、嵌入、图像音频生成、聊天部署等完整功能。

Stars: ⭐️ 509
Tags: ai-platform llm rag ollama openai-api
最后活动时间: 2026-06-05

LLM-API-Key-Proxy

通用 LLM 网关代理，提供兼容 OpenAI/Anthropic 的统一 API 端点，支持多提供商转换与智能负载均衡。

Stars: ⭐️ 507
Tags: llm api-gateway proxy load-balancing
最后活动时间: 2026-05-31

melior

Rust语言的MLIR绑定库，为机器学习编译器基础设施提供原生支持，适用于构建高性能AI模型优化工具。

Stars: ⭐️ 504
Tags: mlir llvm rust compiler
最后活动时间: 2026-04-15

willow-inference-server

开源高性能本地推理服务器，支持ASR语音识别、TTS语音合成和LLM大语言模型推理，提供WebRTC、REST和WebSocket接口。

Stars: ⭐️ 504
Tags: inference-server llm speech-recognition tts whisper
最后活动时间: 2026-02-12

sarathi-serve

一个低延迟、高吞吐量的LLM推理服务引擎，专为大规模语言模型部署优化。

Stars: ⭐️ 504
Tags: llm-inference serving pytorch transformer
最后活动时间: 2026-01-08

streamlit-fastapi-model-serving

使用Streamlit和FastAPI构建PyTorch模型服务Web应用的示例项目。

Stars: ⭐️ 503
Tags: pytorch fastapi streamlit model-serving docker
最后活动时间: 2026-03-27

rust-autograd

Rust语言实现的张量计算与自动微分库，提供类似TensorFlow的可微分操作能力。

Stars: ⭐️ 502
Tags: autograd rust tensor deep-learning
最后活动时间: 2026-06-02

ScaleLLM

面向生产环境的高性能大语言模型推理系统，支持Llama3等主流模型，优化GPU利用率与推理延迟。

Stars: ⭐️ 500
Tags: llm-inference serving gpu cuda production
最后活动时间: 2025-12-19

flash-tokenizer

高效优化的LLM推理分词器引擎，基于C++实现，支持BERT和WordPiece分词。

Stars: ⭐️ 458
Tags: Tokenizer LLM Inference
最后活动时间: 2026-02-02

SDKs & APIs

Omega-AI

基于Java的深度学习框架，支持自动求导、多线程与GPU运算(CUDA/CUDNN)，可快速搭建神经网络。

Stars: ⭐️ 501
Tags: deeplearning neural-network java cuda ai
最后活动时间: 2026-04-22

未分类 (Others)

phoenix

开源AI可观测性平台，支持LLM应用追踪、实验评估和性能监控，帮助开发者调试和优化AI系统。

Stars: ⭐️ 10.1k
Tags: LLMOps Observability Evaluation
最后活动时间: 2026-06-12

zarr-python

Python实现的分块压缩N维数组库，广泛用于机器学习和科学计算中的大规模数据存储与处理。

Stars: ⭐️ 2.0k
Tags: arrays data-storage scientific-computing
最后活动时间: 2026-05-28

fann

快速人工神经网络库，用C语言实现的轻量级神经网络框架，适合嵌入式系统和实时应用。

Stars: ⭐️ 1.7k
Tags: neural-network machine-learning c embedded
最后活动时间: 2026-01-28

ml-compiler-opt

LLVM机器学习引导优化基础设施，利用ML技术提升编译器优化效果。

Stars: ⭐️ 779
Tags: llvm compiler-optimization machine-learning
最后活动时间: 2026-05-27

xprof

专为机器学习设计的性能分析与调优工具，帮助开发者优化ML模型的运行效率和资源利用率。

Stars: ⭐️ 517
Tags: profiling machine-learning performance-analysis
最后活动时间: 2026-05-28

☁️ 基础设施与部署 ​

Cloud & Hosting ​

☁️ 基础设施与部署

Cloud & Hosting